Etch/Sid und UTF-8

Du kommst mit der Installation nicht voran oder willst noch was nachfragen? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
aLiEnTxC
Beiträge: 126
Registriert: 31.07.2004 20:06:04
Kontaktdaten:

Etch/Sid und UTF-8

Beitrag von aLiEnTxC » 17.11.2006 21:41:05

Hallo Gemeinde.

Meine neue Debian installtion macht mich mal wieder warnsinnig... neben verschiedenen anderen Problemen leben ich jetzt schon seid wochen mit Umlautproblemen..

Egal wo ich bin.. die Umlaute werden meist mit einem invertiertem Fragezeichen ausgegeben.

Nach etwas forschung habe ich hier herausgefunden, dass der Debian Etch Installer Beta2 nun defaultmäßig das System auf UTF-8 einrichtet...

Das wäre ja alles wunderbar, wenns denn auch richtig funktionieren würde...

An folgenden Stellen sind mir die Fehler aufgefallen:
In der Konsole
beim öffnen von Dateien die nicht in UTF-8 verfasst wurden
Bei ssh verbindungen auf andere Systeme
Bei meinem apache der auf dem system läuft (die gleichen dokumente auf einem anderen apache haben nicht diese fehler - EDIT: Der Fehler wird auch nur auf dem lokalen system sichbar - Browser ist Firefox)

Was eben besonders Nervend ist, ist dass die meisten Editoren nicht automatich erkennen in welchem Format die Datei verfasst wurde... da ich meist Dateien verarbeite die in ISO norm verfasst/gespeichert wurden, stehe ich da vor einem größerem Problem.

Wenn ich nämlich soch eine Datei öffne und bearbeite werden die darin befindlichen umlaute alle zerstört! So langsam nervt das eben richtig...

Hat jemand ne Idee wie ich es entweder deaktiviere oder so einstellen kann, dass diese Problme nicht mehr vorhanden sind?

Ich hoffe mir kann geholfen werden.. wenn nicht muss ich wohl leider wieder zurück zu sarge oder einer anderen distrie (obwohl ich debian eigentlich genial finde) wecheln.

Gruß,
Thomas

gms
Beiträge: 7798
Registriert: 26.11.2004 20:08:38
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von gms » 18.11.2006 00:10:45

aLiEnTxC hat geschrieben:Was eben besonders Nervend ist, ist dass die meisten Editoren nicht automatich erkennen in welchem Format die Datei verfasst wurde...
hier geht es aber nicht um ein Dateiformat (wie z.B. pdf, html, xml) sondern um einen Zeichensatz. Es müßte daher das GANZE Dokument nach Abfolgen gültiger Unicode Codierungen durchkämmt werden ( die Latin Zeichen werden ja bei UTF-8 auch verwendet) und daraus eine Wahrscheinlichkeit berechnet werden.
aLiEnTxC hat geschrieben: Hat jemand ne Idee wie ich es entweder deaktiviere oder so einstellen kann, dass diese Problme nicht mehr vorhanden sind?
wird wahrscheinlich noch immer mit "dpkg-reconfigure locales" gehen.

Gruß
gms

aLiEnTxC
Beiträge: 126
Registriert: 31.07.2004 20:06:04
Kontaktdaten:

Beitrag von aLiEnTxC » 18.11.2006 00:58:34

gms hat geschrieben:
aLiEnTxC hat geschrieben: Hat jemand ne Idee wie ich es entweder deaktiviere oder so einstellen kann, dass diese Problme nicht mehr vorhanden sind?
wird wahrscheinlich noch immer mit "dpkg-reconfigure locales" gehen.
nope.. leider nicht.. habe es schon auf de_DE@euro gestellt, aber die Probleme treten immer noch auf :roll:

Benutzeravatar
deadeye
Beiträge: 561
Registriert: 14.04.2004 15:32:18
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Ukio, rechts hinterm Feld
Kontaktdaten:

Re: Etch/Sid und UTF-8

Beitrag von deadeye » 18.11.2006 01:13:46

Hi,
aLiEnTxC hat geschrieben: Bei meinem apache der auf dem system läuft (die gleichen dokumente auf einem anderen apache haben nicht diese fehler
Man kann dem Indianer sagen, mit welchem Encoding er die Dateien ausliefern soll. Ob der Browser, dass dann auch respektiert und benutzt ist aber ne andere Geschichte.
Es gibt da eine Direktive names

Code: Alles auswählen

AddDefaultCharset utf-8
Mehr dazu verrät das Apache-Handbuch.
aLiEnTxC hat geschrieben:Was eben besonders Nervend ist, ist dass die meisten Editoren nicht automatich erkennen in welchem Format die Datei verfasst wurde... da ich meist Dateien verarbeite die in ISO norm verfasst/gespeichert wurden, stehe ich da vor einem größerem Problem.
Hmm, leidiges Thema. Kenne das nur zu gut. Ich schreibe an einem Editor/IDE, der mittlerweile auch mehr als UTF-8 kann. Problem an der Sache ist(und auch Grund warum viele Editoren es nicht anbieten) es scheint keinen vernünftigen Weg zu geben, die Kodierung einer Datei korrekt zu ermitteln. Anjuta, Gedit und auch das meine kleine Programm, machen das etwas unschön, indem sie versuchen, die zu öffnende Datei in alle verfügbaren, bekannten Kodierungen umzuwandeln und sobald kein Fehler auftritt, nimmt man an, dass man die richtige Kodierung gefunden hat(funktioniert übrigens für ISO-8859-1|15 wunderbar). Mir ist klar, wie suboptimal das ist und von Performance will ich mal gar nicht reden, aber so ist das Leben.
Wenn jemand nen Vorschlag hat, her damit ,-).

Zurück zum Problem: gerade das angesprochene Problem mit dem Öffnen von Dateien hat aber nix mit Debian zu tun, sondern nur mit der entsprechenden Anwendung. Ein Wechsel zu einer anderen Distri wird das auch nicht lösen, denn ArchLinux, Fedora und sicher auch SuSE nutzen auch UTF-8, weil es einfach viel besser ist als alles andere.


Welche Konsole nutzt Du? Wenn Dein System auf UTF-8 läuft, solltest Du dort auch Umlaute eingeben können.

Das Thema mit den SSH-Verbindungen lässt sich IMO nicht lösen, wenn auf dem entfernten Rechner ein nicht-UTF-8 System läuft, klappt das eben nicht, zum. weiß ich nicht wie. Richtig interessant und deutlich wird das, wenn man den midnight commander benutzt und eines der Systeme UTF-8 und das andere eine ISO-Kodierung nutzt. Sehr unangenehm.

HTH,
deadeye

Benutzeravatar
brahma
Beiträge: 653
Registriert: 28.08.2003 11:05:46
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Münsterland

Beitrag von brahma » 18.11.2006 11:03:54

Ich habe das gleiche Problem, und leider lässt es sich nicht beheben...

dpkg-reonfigure locale schlägt fehl. Stell ich dort um auf ISO-8859-15 beschwert X sich das UTF-8 nicht verfürbar ist.

Interessant war gerade z.B. das ich in Thunderbird, ah sorry, Icedove auch keine Umlaute habe. Dann hab ich den Zeichensatz auf UTF-8 gestellt, und dann gings bei einer Email. Wenn ich den Zeichensatz auf ISO-8859-15 stelle, geht kein Umlaut....
/* NO COMMENT */

Benutzeravatar
holgerw
Beiträge: 1489
Registriert: 13.03.2003 16:19:00
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Marburg

Beitrag von holgerw » 18.11.2006 13:26:56

brahma hat geschrieben:Ich habe das gleiche Problem, und leider lässt es sich nicht beheben...

dpkg-reonfigure locale schlägt fehl. Stell ich dort um auf ISO-8859-15 beschwert X sich das UTF-8 nicht verfürbar ist.
Hi,

was steht in der Datei /etc/environment? Ich habe mein System mit

Code: Alles auswählen

dpkg-reconfigure locales
auf de_DE@euro umgestellt und in die /etc/environment auch de_DE@euro eingetragen. Grund: Die Umlaute der deutschen Manpages wurden im Konqueror nicht dargestellt bei utf-8. Unter de_DE@euro tritt dieser Fehler nicht auf.

Beste Grüße,
Holger

Benutzeravatar
xcomm
Beiträge: 804
Registriert: 21.09.2003 05:12:01
Wohnort: Europe
Kontaktdaten:

Beitrag von xcomm » 27.02.2007 15:44:02

Das Thema mit den SSH-Verbindungen lässt sich IMO nicht lösen,

Um von UTF-8 auf ein 8859-15 System zu gehen, z.B:

Code: Alles auswählen

luit -encoding ISO8859-15 ssh 192.168.1.2
luit kommt mit xutils.

Best Regards, xcomm

cirox
Beiträge: 70
Registriert: 23.06.2006 20:37:57

Beitrag von cirox » 15.03.2007 00:01:34

aLiEnTxC hat geschrieben: Bei meinem apache der auf dem system läuft (die gleichen dokumente auf einem anderen apache haben nicht diese fehler - EDIT: Der Fehler wird auch nur auf dem lokalen system sichbar - Browser ist Firefox)
hier ist der bug:

http://www.mail-archive.com/debian-apac ... 08118.html
  • This will modify apache configuration during an upgrade. Eventually will
    cause all sites served locally to be IMPACTED by wrong charsets [mozilla
    selects utf8 if apache told him that its the default - even if the page
    designer used the content="text/html; charset=ISO-8859-15" in headers].

    And this is clearly NOT wanted.
Also unter /etc/apache2/conf.d diesen dämlichen ! Default Charset auskommentieren und alles wird gut ...

artemis
Beiträge: 447
Registriert: 21.12.2005 23:11:11

Beitrag von artemis » 15.03.2007 04:15:24

Hallo,
mal ne "Lösung" zu dem ssh Problem...:
Hatte hier auch das Problem, hab meinem Laptop mit utf8 und nen anderen PC mit iso15 laufen. Nun greif ich mit meinem Laptop auf den anderen PC per ssh zu. Da ich Gnome verwende, benutze ich das Gnome-Terminal. Da kann man unter Terminal->Zeichenkodierung einstellen, welche es verwenden soll. Von xterm gibt es im Debian Menu auch zwei Versionen, eine startet xterm mit utf8, die andere ohne...
Klappt natürlich so nur unter X...

artemis

debian inside
Beiträge: 65
Registriert: 13.03.2004 10:41:31

Beitrag von debian inside » 07.05.2007 10:09:53

hmm apache2 ... danke

und ich hab immer bei mysql und im html code herumprobiert :D

Antworten