Zeichensätze unter Debian = Mission Impossible?
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Zeichensätze unter Debian = Mission Impossible?
Hallo zusammen,
dies ist wohl mein letzter Hilferuf bevor ich Debian runterschmeisse und wieder auf Gentoo wechsle.
Wie ich bereits im Topic beschrieben habe geht es um das leidige Thema der Zeichensätze.
Die Vorgeschichte:
Ich benutze Gnome als Desktop und da ich ein Fan von Bleeding Edge Software bin benutze ich natürlich die neueste Version aus unstable. Ich war auch ganz zufrieden mit meinem ersten Debian-Desktop bis mir plötzlich auffiel das Nautilus in der Adresszeile anscheinend nicht mit Umlauten und Leerzeichen klarkommt (Leerzeichen werden durch %20% ersetzt und Umlaute durch irgendeinen anderen Kram). Da ich ja schon ein wenig Erfahrung mit Linux hatte wusste ich natürlich das es nur an dem verwendeten Zeichensatz oder an den Locales liegen kann. Jedoch kam es mir gleich ein wenig spanisch vor das Nautilus die Umlaute und Leerzeichen unter den Symbolen korrekt darstellen konnte. Ebenfalls wurden die Umlaute in allen anderen Programmen (gtk1, gtk2, Terminal, kde, Mozilla usw.) korrekt dargestellt. Wie stellt man nun also die Zeichensätze bei Debian um?
Ich bin dazu strikt nach diesem HowTo vorgegangen:
http://www.debianforum.de/guides/index. ... 1002&id=54
Ich habe alles so eingestellt das als locale überall "de_DE@euro.ISO8859-15" verwendet wird. Resultat: Das Problem mit Nautilus besteht weiterhin.
Der zweite Lösungsansatz (Die UTF-8-Lösung):
Ich bin also das ganze HowTo nochmal durchgegangen und habe alles auf "de_DE.UTF-8" umgestellt. Habe anschliessend meine ganzen Dateinamen mit dem Tool "convmv" von ISO8859 auf UTF-8 konvertiert.
Resultat: Es klappt jetzt mit Nautilus
Nebenwirkung: Alle GTK1-Programme habe jetzt eine grässliche Schrift und - keine Umlaute !!!
Nach diversen weiteren Umstellungsversuchen, Recherche in Newsgroups, Foren und Google, bin ich zu dem Schluss gekommen: Es geht anscheinend einfach nicht !!! Es muss wohl ein Bug im Nautilus-Paket von Debian sein.
Also, ich bin mit meinem Latein am Ende und nach mehreren Stunden herumprobieren auch stark gefrustet. Ich hoffe das mir hier noch jemand einen Tip geben kann.
dies ist wohl mein letzter Hilferuf bevor ich Debian runterschmeisse und wieder auf Gentoo wechsle.
Wie ich bereits im Topic beschrieben habe geht es um das leidige Thema der Zeichensätze.
Die Vorgeschichte:
Ich benutze Gnome als Desktop und da ich ein Fan von Bleeding Edge Software bin benutze ich natürlich die neueste Version aus unstable. Ich war auch ganz zufrieden mit meinem ersten Debian-Desktop bis mir plötzlich auffiel das Nautilus in der Adresszeile anscheinend nicht mit Umlauten und Leerzeichen klarkommt (Leerzeichen werden durch %20% ersetzt und Umlaute durch irgendeinen anderen Kram). Da ich ja schon ein wenig Erfahrung mit Linux hatte wusste ich natürlich das es nur an dem verwendeten Zeichensatz oder an den Locales liegen kann. Jedoch kam es mir gleich ein wenig spanisch vor das Nautilus die Umlaute und Leerzeichen unter den Symbolen korrekt darstellen konnte. Ebenfalls wurden die Umlaute in allen anderen Programmen (gtk1, gtk2, Terminal, kde, Mozilla usw.) korrekt dargestellt. Wie stellt man nun also die Zeichensätze bei Debian um?
Ich bin dazu strikt nach diesem HowTo vorgegangen:
http://www.debianforum.de/guides/index. ... 1002&id=54
Ich habe alles so eingestellt das als locale überall "de_DE@euro.ISO8859-15" verwendet wird. Resultat: Das Problem mit Nautilus besteht weiterhin.
Der zweite Lösungsansatz (Die UTF-8-Lösung):
Ich bin also das ganze HowTo nochmal durchgegangen und habe alles auf "de_DE.UTF-8" umgestellt. Habe anschliessend meine ganzen Dateinamen mit dem Tool "convmv" von ISO8859 auf UTF-8 konvertiert.
Resultat: Es klappt jetzt mit Nautilus
Nebenwirkung: Alle GTK1-Programme habe jetzt eine grässliche Schrift und - keine Umlaute !!!
Nach diversen weiteren Umstellungsversuchen, Recherche in Newsgroups, Foren und Google, bin ich zu dem Schluss gekommen: Es geht anscheinend einfach nicht !!! Es muss wohl ein Bug im Nautilus-Paket von Debian sein.
Also, ich bin mit meinem Latein am Ende und nach mehreren Stunden herumprobieren auch stark gefrustet. Ich hoffe das mir hier noch jemand einen Tip geben kann.
wenn du bleeding-edge willst, bekommst du bleeding edge ... mit allen problemen.top und da ich ein Fan von Bleeding Edge Software bin
hi.
also ich hab mit dem nautilus aus sarge diese probleme nicht.
(ein paar andere probs vielleicht )
die gtk1-schriften sahen bei mir immer gruselig aus, aber wenn du
gnome aus sid benutzt, welche gtk1 programme nutzt du dann überhaupt noch?
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Re: Zeichensätze unter Debian = Mission Impossible?
Umlaute und Leerzeichen in der Nautilus-Adressleiste funktionieren bei mir mit SID und de_DE@euro.iso8859-15 problemlos.stefann1977 hat geschrieben:Nach diversen weiteren Umstellungsversuchen, Recherche in Newsgroups, Foren und Google, bin ich zu dem Schluss gekommen: Es geht anscheinend einfach nicht !!! Es muss wohl ein Bug im Nautilus-Paket von Debian sein.
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Klar, kann ich machen.
Code: Alles auswählen
# /etc/environment
LANG=de_DE@euro
LC_MESSAGES=C
LC_NUMERIC=C
Code: Alles auswählen
# /etc/locale.gen
de_DE ISO-8859-1
de_DE@euro ISO-8859-15
en_US ISO-8859-1
de_DE.UTF-8@euro UTF-8
de_DE.UTF-8 UTF-8
Code: Alles auswählen
# locale
LANG=de_DE@euro
LC_CTYPE="de_DE@euro"
LC_NUMERIC=C
LC_TIME="de_DE@euro"
LC_COLLATE="de_DE@euro"
LC_MONETARY="de_DE@euro"
LC_MESSAGES=C
LC_PAPER="de_DE@euro"
LC_NAME="de_DE@euro"
LC_ADDRESS="de_DE@euro"
LC_TELEPHONE="de_DE@euro"
LC_MEASUREMENT="de_DE@euro"
LC_IDENTIFICATION="de_DE@euro"
LC_ALL=
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Danke.
Habe deine Settings ausprobiert. Klappt aber auch nicht. Ich bin jetzt aber ein Stückchen weiter in der Fehleranalyse.
Wie es aussieht benutzt Nautilus definitiv UTF-8. Wenn ich in Nautilus einen neuen Ordner mit Umlauten und Leerzeichen erstelle, kann Nautilus diesen Ordner korrekt in der Adressleiste darstellen. Schaut man sich dieses neue Verzeichnis aber im Gnome-Terminal an gibts wieder Probleme mit Umlauten und Leerzeichen. Wenn ich den Ordner dann per convmv -f utf8 -t iso-8859-15 konvertiere ist es wieder wie vorher (Gut im Terminal, schlecht in Nautilus). Hach verdammt! Wo kriegt Nautilus bloss gesagt welche Zeichenkodierung er verwenden soll?
Habe deine Settings ausprobiert. Klappt aber auch nicht. Ich bin jetzt aber ein Stückchen weiter in der Fehleranalyse.
Wie es aussieht benutzt Nautilus definitiv UTF-8. Wenn ich in Nautilus einen neuen Ordner mit Umlauten und Leerzeichen erstelle, kann Nautilus diesen Ordner korrekt in der Adressleiste darstellen. Schaut man sich dieses neue Verzeichnis aber im Gnome-Terminal an gibts wieder Probleme mit Umlauten und Leerzeichen. Wenn ich den Ordner dann per convmv -f utf8 -t iso-8859-15 konvertiere ist es wieder wie vorher (Gut im Terminal, schlecht in Nautilus). Hach verdammt! Wo kriegt Nautilus bloss gesagt welche Zeichenkodierung er verwenden soll?
Hm, hab grad mal ein wenig rumgespielt. Wenn ich mit Nautilus einen neuen Ordner anlege, dann ist der auch bei mir UTF-8 kodiert und demensprechend im Gnome-Terminal nicht richtig lesbar.
Lege ich den Ordner im Gnome-Terminal an, ist er ISO8859-15 kodiert und die Dastellung sind im Gnome-Terminal und im Nautilus richtig.
Das Problem scheint übrigens nicht nur Nautilus zu betreffen. Wenn ich mit gedit eine Datei mit Umauten im Namen speichere, verwendet der auch UTF-8.
Lege ich den Ordner im Gnome-Terminal an, ist er ISO8859-15 kodiert und die Dastellung sind im Gnome-Terminal und im Nautilus richtig.
Das Problem scheint übrigens nicht nur Nautilus zu betreffen. Wenn ich mit gedit eine Datei mit Umauten im Namen speichere, verwendet der auch UTF-8.
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Bei Nautilus ist das besonders ärgerlich weil man dann die Skript-Funktion eigentlich wegwerfen kann.
Bei gedit kannst du aber im Speichern-Dialog auswählen in welcher kodierung gespeichert werden soll. Standardmässig ist da aber auch UTF-8 eingestellt.
Ich habe einfach mal einen Fehlerbericht über dieses Nautilus-Problem an Debian.org geschickt. Da muss irgendwas beim kompilieren vergessen worden sein. Mal sehen was dabei rumkommt.
Bei gedit kannst du aber im Speichern-Dialog auswählen in welcher kodierung gespeichert werden soll. Standardmässig ist da aber auch UTF-8 eingestellt.
Ich habe einfach mal einen Fehlerbericht über dieses Nautilus-Problem an Debian.org geschickt. Da muss irgendwas beim kompilieren vergessen worden sein. Mal sehen was dabei rumkommt.
Da hast Du mich jetzt falsch verstanden. Es ging mir um den Dateinamen, nicht den Inhalt der erstellten Datei. Die Datei wird immer mit einem UTF-8 kodierten Namen angelegt.stefann1977 hat geschrieben:Bei gedit kannst du aber im Speichern-Dialog auswählen in welcher kodierung gespeichert werden soll. Standardmässig ist da aber auch UTF-8 eingestellt.
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Habe eine Antwort auf meinen Fehlerbericht bekommen:
Aha, interessant. Ich kenne dieses Verhalten nicht von Gentoo. Wahrscheinlich haben die von Gentoo ihre GTK2-Sourcen irgendwie gepatcht. Aber in jedem Fall gut zu wissen.
This is definitely as it should be. GTK+ 2 and GNOME 2 applications
assume all filenames are UTF-8 encoded, because such stuff cannot depend
on the locale.
If you really want to have your files encoded in the current locale's
character set, you have to set the G_BROKEN_FILENAMES environment
variable to 1.
Regards,
--=20
.''`. Josselin Mouette /\./\
: :' : josselin.mouette@ens-lyon.org
`. `' joss@debian.org
`- Debian GNU/Linux -- The power of freedom
Aha, interessant. Ich kenne dieses Verhalten nicht von Gentoo. Wahrscheinlich haben die von Gentoo ihre GTK2-Sourcen irgendwie gepatcht. Aber in jedem Fall gut zu wissen.
Das ist auch meine Beobachtung. Kann man nur hoffen , dass die Gnome-Entwickler mal wieder zur Besinnung kommen.This is definitely as it should be. GTK+ 2 and GNOME 2 applications
assume all filenames are UTF-8 encoded, because such stuff cannot depend
on the locale.
Und mit dieser Variable funktionieren dann einige nette Funktionen in den Gnome-Applikationen nicht.If you really want to have your files encoded in the current locale's
character set, you have to set the G_BROKEN_FILENAMES environment
variable to 1.
Gruß
ernohl
ernohl
-
- Beiträge: 26
- Registriert: 29.03.2003 16:05:20
Ich glaube die Gnome-Entwickler machen im Prinzip alles richtig. UTF-8 ist besser. Vorraussetzung ist natürlich das alle Programme unter Linux das auch unterstützen.
Genauso ist es mit GTK. Ich kriege immer zuviel wenn ich sehe das immer noch neue Programme erscheinen die in GTK-1 programmiert sind.
Genauso ist es mit GTK. Ich kriege immer zuviel wenn ich sehe das immer noch neue Programme erscheinen die in GTK-1 programmiert sind.
Der Meinung bin ich überhaupt nicht. Ich habe in meinem Leben schon so viel mit Zeichensätzen und deren Konvertierung zu tun gehabt, dass ich mir erlaube, folgende These aufzustellen:stefann1977 hat geschrieben:Ich glaube die Gnome-Entwickler machen im Prinzip alles richtig. UTF-8 ist besser. Vorraussetzung ist natürlich das alle Programme unter Linux das auch unterstützen.
Unicode und deren umfassenden Umsetzung ist einerseits ein so ein kompliziertes Thema, dass es Jahrzehnte brauchen würde, um es umfassend allgemein einzuführen. Andererseit ist der Nutzen äußerst minimal. Er wäre nur in einer Welt ohne Zeichensatzdeklaration notwendig. Haben wir diese? Nein! Also überflüssig und dazu (weil unausgereift) potentiell und tatsächlich fehlerbehaftet.
Andererseits wäre ja nichts dagegen zu sagen, wenn die Entwickler sich 'mal Gedanken machen würden. Aber nein, bestehende Systeme und Daten (ISO-8859) werden einfach ignoriert. Siehe Antwortmail: "because such stuff cannot depend on the locale". Da weiß jemand nicht, wovon er redet.
UTF-8 ist besser? Mag sein! Wenn wir keinen PKW mehr in der Garage hätten, sondern ein Univarsalteil aus PKW, Truck, Yacht, Flieger, Hubschrauber,... wäre das auch besser. Wird das passieren? Warum wohl nicht?
Wird sich Unicode in absehbarer Zeit durchsetzen? Ich halte dagegen.
Gruß
ernohl
ernohl
Mag ja sein, daß UTF-8 besser ist. Aber wenn ich UTF-8 benutzen möchte, dann wähle ich ne UTF-8 Locale.stefann1977 hat geschrieben:Ich glaube die Gnome-Entwickler machen im Prinzip alles richtig. UTF-8 ist besser. Vorraussetzung ist natürlich das alle Programme unter Linux das auch unterstützen.
Ist das so!?ernohl hat geschrieben:Unicode und deren umfassenden Umsetzung ist einerseits ein so ein kompliziertes Thema, dass es Jahrzehnte brauchen würde, um es umfassend allgemein einzuführen.
AFAIK läuft beispielsweise Red Hat 9 komplett unter UTF-8, und auch bei der Konkurenz aus dem Hause Microsoft werkelt (zumindest bei allen NT bsaierten Systemen) Unicode unter der Haube.
Ähm, die Unmenge von Zeichensatzkodierungen sind gerade das Problem, das Unicode aus der Welt schaffen soll. Mit Unicode ist das Hin- und Herkonvertieren zwischen verschiedenen Encodings überflüssig.ernohl hat geschrieben:Andererseit ist der Nutzen äußerst minimal. Er wäre nur in einer Welt ohne Zeichensatzdeklaration notwendig. Haben wir diese? Nein!
Ja, genauso überflüssig und fehlerbehaftet, wie jede ander Zeichensatzkodierung auch.ernohl hat geschrieben:Also überflüssig und dazu (weil unausgereift) potentiell und tatsächlich fehlerbehaftet.
Und ich würde sagen, Unicode hat sich bereits durchgesetzt.ernohl hat geschrieben:Wird sich Unicode in absehbarer Zeit durchsetzen? Ich halte dagegen.
Hallo!?! Wie willst du das erreichen. Durch Umlegen eines Schalters, der von jetzt auf sofort alle *Systeme* auf UTF-8 umstellt oder durch eine allmähliche Einführung.spiffi hat geschrieben: Ähm, die Unmenge von Zeichensatzkodierungen sind gerade das Problem, das Unicode aus der Welt schaffen soll. Mit Unicode ist das Hin- und Herkonvertieren zwischen verschiedenen Encodings überflüssig.
Ersteres ist unmöglich, für 2. müssen die Systeme beides (1-Byte.Zeichensätze und Unicode) perfekt beherrschen. Das ist ungleich schwieriger als reines UTF-8.
Und ganz wichtig: Wir reden hier nicht vom Umgang mit UTF-8-Dateien, sondern von UTF-8-Systemen (Kernel, Shell, Filesysteme, bla, bla,...)
Ach ja? Warum gibt es sie denn? Weil du viel schlauer bist als all die Leute, die dies mal eingeführt haben, zusammen? Und dann schau dir mal an, wieso noch heute etliche Programme/Systeme sogar noch Probleme mit einem ISO-8859-ZS haben? Vielleicht weil es eine Menge Arbeit und Gehirnschmalz erforderte, brauchbar von ASCII auf ISO-8859 umzustellen. Und das waren beides 1-Byte-ZS. Die Gnome-Leute (als selbsternannte UTF-8-Profis) sind nicht mal in der Lage, vernünftig mit ISO-8859-Dateien (*Dateien!*) umzugehen. Aber wer braucht schon noch seine Altdaten?spiffi hat geschrieben:Ja, genauso überflüssig und fehlerbehaftet, wie jede ander Zeichensatzkodierung auch.ernohl hat geschrieben:Also überflüssig und dazu (weil unausgereift) potentiell und tatsächlich fehlerbehaftet.
Selten so gelacht. *ROFL*spiffi hat geschrieben:Und ich würde sagen, Unicode hat sich bereits durchgesetzt.ernohl hat geschrieben:Wird sich Unicode in absehbarer Zeit durchsetzen? Ich halte dagegen.
Gruß
ernohl
ernohl