Rückspeichern einer ISO-8859-15-Datei nicht möglich/erledigt

Warum Debian und/oder eine seiner Spielarten? Was muss ich vorher wissen? Wo geht es nach der Installation weiter?
Antworten
Benutzeravatar
uwepr
Beiträge: 657
Registriert: 03.02.2007 12:13:01
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Halle/S.
Kontaktdaten:

Rückspeichern einer ISO-8859-15-Datei nicht möglich/erledigt

Beitrag von uwepr » 19.09.2008 09:56:55

Seid gegrüßt!
Zur Zeit sitze ich an einer Neufassung von http://www.aquarienverein-rossmaessler-halle.de/
Die über "Wir über uns" erreichbare Unterseite enthält An- und Abführungszeichen.
Wenn ich
Der Verein „Roßmäßler-Vivarium 1906“ e. V. ist ein Zusammenschluss für Freunde und Liebhaber von Aquarie
in die neue Seite, welche im Zeichensatz ISO-8859-15 kodiert ist, einfüge, erhalte ich bei'm Rückspeichern folgende Meldung:
Die Datei »/home/uwe/CSS/Roßmäßler/index.htm« konnte mit der Zeichenkodierung »Westlich (ISO-8859-15)« nicht gespeichert werden.
Mein System:

Code: Alles auswählen

uwe@debian-uwe:~$ locale -a
C
de_DE
de_DE@euro
de_DE.iso88591
de_DE.iso885915@euro
de_DE.utf8
deutsch
en_GB
en_GB.iso88591
en_GB.iso885915
en_GB.utf8
en_US
en_US.iso88591
en_US.iso885915
en_US.utf8
german
POSIX
uwe@debian-uwe:~$ locale
LANG=de_DE.UTF-8
LC_CTYPE=de_DE.UTF-8
LC_NUMERIC=de_DE@euro
LC_TIME="de_DE.UTF-8"
LC_COLLATE="de_DE.UTF-8"
LC_MONETARY=de_DE@euro
LC_MESSAGES="de_DE.UTF-8"
LC_PAPER=de_DE@euro
LC_NAME="de_DE.UTF-8"
LC_ADDRESS="de_DE.UTF-8"
LC_TELEPHONE="de_DE.UTF-8"
LC_MEASUREMENT="de_DE.UTF-8"
LC_IDENTIFICATION="de_DE.UTF-8"
LC_ALL=
uwe@debian-uwe:~$ 
Was ich bisher selbst versucht habe:
folgende Programme probiert:
gedit
geany
bluefish
immer der gleiche Fehler.

Neues Benutzerkonto mit Standardzeichensatz ISO-8859-15 erstellt ==>gleicher Fehler.

Nachdem ich die An- und Abführungszeichen durch „ u. ” ersetzt habe, konnten die Änderungen gespeichert werden, nuuuuuur ich schreibe für Leute, die nur Windows kennen und keine wirkliche Ahnung von HTML haben und noch nie in ihrem Leben ein Entitie gesetzt haben. Mein System läuft seit Jahren mit UTF-8, weshalb ich nicht wegen eines Projektes auf ein ISO-8859-15-System umstellen will. Einstweilen benutze ich für das Projekt Win + notepad++, an welches ich die Vereinsfreunde heranführen will....

Hat jemand eine Lösung unter einem UTF-8-System?
Viele Grüße! Uwe Pr.
Zuletzt geändert von uwepr am 22.09.2008 09:33:57, insgesamt 1-mal geändert.
squeeze/fluxbox

nepos
Beiträge: 5238
Registriert: 05.01.2005 10:08:12

Re: Rückspeichern einer ISO-8859-15-Datei nicht möglich

Beitrag von nepos » 19.09.2008 10:00:15

Problem dürfte sein, dass es für die tiefgestellten Anführungszeichen keine Entsprechung in ISO-8859-15 gibt. Versuch mal, das mit "..." zu schreiben.

Benutzeravatar
uwepr
Beiträge: 657
Registriert: 03.02.2007 12:13:01
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Halle/S.
Kontaktdaten:

Re: Rückspeichern einer ISO-8859-15-Datei nicht möglich

Beitrag von uwepr » 19.09.2008 17:19:58

Hallo nepos,
"..." geht natürlich und würde mir persöhnlich auch reichen, aber der Vereinsvorsitzende ist pensionierter Deutsch-Lehrer, deshalb möchte ich korrekte Typographie liefern.
Einstweilen viele Grüße!
Uwe Pr.
squeeze/fluxbox

Benutzeravatar
LessWire
Beiträge: 558
Registriert: 21.11.2004 04:36:04
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Bavaria

Re: Rückspeichern einer ISO-8859-15-Datei nicht möglich

Beitrag von LessWire » 22.09.2008 05:07:15

Was spricht dagegen, die ganze Seite auf utf-8 umzustellen und durch entsprechenden Header-Eintrag "charset=utf-8" die Browser der künftigen Besucher darauf hinzuweisen?

Jeder etwas neuere Browser kann utf-8. Ich denke, es macht jetzt keinen Sinn mehr, die Umstellung noch länger zu verzögern.

vg, L.W.
at ~ now.

Benutzeravatar
uwepr
Beiträge: 657
Registriert: 03.02.2007 12:13:01
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Halle/S.
Kontaktdaten:

Re: Rückspeichern einer ISO-8859-15-Datei nicht möglich

Beitrag von uwepr » 22.09.2008 09:33:23

Hallo LessWire,
ich wollte dem Vereinsvorsitzenden, wenn er seine "Rundbriefe" schreibt, Entities ersparen, möglich sind „und “bzw. „ und “. An den Entities geht aber kein Weg mehr vorbei: nachdem ich unter Win per c&p Texte aus der derzeitigen Seite eingesetzt habe ergab ein File-Upload gestern Abend an den Validator bei HTML 4.0.1 als auch bei XHTML 1.0 eine entsprechende Fehlermeldung, sinngemäß daß "nur Zeichen x -xx und xx-xxx aus dem UTF-8-Zeichenvorrat zulässig sind und die An-und Abführungszeichen als Entitie gesetzt werden müssen". Damit hat sich das Speicherproblem erledigt. Es würde nur eine Hundearbeit werden, die ganzen Entities in den vorhandenen Seitentexten zu ersetzen, werde mal schauen, ob ich 'ne Lösung mit sed dafür finde...
Was spricht dagegen, die ganze Seite auf utf-8 umzustellen und durch entsprechenden Header-Eintrag "charset=utf-8" die Browser der künftigen Besucher darauf hinzuweisen?
edit: Nichts!
Setze das hier nach dem Posten auf "erledigt".
Viele Grüße! Uwe Pr.

P.S.: http://www.aquarienverein-rossmaessler- ... 2008-4.htm
ganz unten "Humor"
squeeze/fluxbox

Benutzeravatar
uwepr
Beiträge: 657
Registriert: 03.02.2007 12:13:01
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Halle/S.
Kontaktdaten:

Re: Rückspeichern einer ISO-8859-15-Datei nicht möglich/erledigt

Beitrag von uwepr » 29.09.2008 09:04:08

Wollte nur mal berichten, welche Lösung sich nun ergeben hat:
Zu kopierenden Text in openoffice-writer eingefügt und das Ganze als html-Document gespeichert,
dann mit gedit geöffnet, und den dann bereits utf-8-kodierten Text in die zu erstellende Webseite eingefügt.
Nachteil: durch Lokalisierung auf en_US werden durch openoffice die Umlaute durch Entities ersetzt, was die Lesbarkeit und Suchmaschinenfreundlichkeit einschränkt.
Dann kam mir die Idee einer benutzerdefinierten Gnome-Zeichenpalette:
die UTF-8-kodierte HTML aus openoffice enthielt bereits korrekte nicht durch Entities gesetzte An-, Abführungszeichen und Gedankenstriche, mit welchen ich per c&p eine Palette erstellte.
Damit war es dann möglich, direkt aus der alten Webseite ISO-Texte herauszukopieren und die An-, Abführungszeichen und Gedankenstriche per Gnome-Zeichenpalette zu ersetzen.
Nach dem nächsten Sitzungsstart kam die Überraschung: gedit macht die Übertragung von ISO nach UTF-8 nun komplett automatisch, keine Ahnung, warum das jetzt geht, habe bisher seit thread-start kein update gemacht.

Und was sagt der Validator dazu?
An-, Abführungszeichen und Gedankenstriche aus dem UTF-8-Zeichensatz sind in HTML 4.0.1 als auch XHTML 1.0 zulässig, hingegen aus dem ISO-Zeichensatz nicht.
Einziger Wermutstropfen der mit gedit erzeugten Seiten:

Code: Alles auswählen

Byte-Order Mark found in UTF-8 File.

The Unicode Byte-Order Mark (BOM) in UTF-8 encoded files is known to cause problems for some text editors and older browsers. You may want to consider avoiding its use until it is better supported. 
aber das zu entfernen ist ein anderes Thema.
Viele Grüße!
Uwe Pr.
squeeze/fluxbox

Antworten