[git] das Umlaut-Problem
[git] das Umlaut-Problem
Ich versuche das Umlaut-Problem bei git zu verstehen. Ohne das Verständnis, weiß ich nämlich nicht, welche der zahlreichen encoding-optionen ich in .gitconfig setzen sollte.
Ein git status zeigt mir beispielsweise sowas als Dateinamen an: "pr\303\244si.tex"
Nun sei laut Doku git "encoding agnostic" - (re)kodiert hier also per default erstmal gar nix.
Aber sehen den Umlaute im Linux-Dateisystem so aus? Oder liegt es an der Bash? Was ist wirklich der Hintergrund?
Also ich beobachte das Phänomen auf der Bash in Debian unstable und Ubuntu Trusty.
Ein git status zeigt mir beispielsweise sowas als Dateinamen an: "pr\303\244si.tex"
Nun sei laut Doku git "encoding agnostic" - (re)kodiert hier also per default erstmal gar nix.
Aber sehen den Umlaute im Linux-Dateisystem so aus? Oder liegt es an der Bash? Was ist wirklich der Hintergrund?
Also ich beobachte das Phänomen auf der Bash in Debian unstable und Ubuntu Trusty.
-
- Beiträge: 3799
- Registriert: 26.02.2009 14:35:56
Re: [git] das Umlaut-Problem
Um solchen Problemen - auch bei Windows-usern aus dem Weg zu gehen, empfehle ich immer grundsätzlich nur die Buchstaben a-7 und Zifern 0 - 9 für die Namensgebung. Gibt, egal welches System, immer wieder damit Probleme - spätestens wenn z.B der USB-Stick mit Linux erstellt - und mit Mac oder Windows verwendet wird. Ich hatte mal eine Kollegin, die hatte ihren Rechner Bärchen (mit Umlaut ä) genannt. War ne Windows-Kiste und es gab die verschiedensten Probleme, Abstürze, nichtfunktionieren usw. Nach einer Änderung auf Baerchen war alles gut.
Re: [git] das Umlaut-Problem
Es gibt einen definierten und verbindlichen Standard für utf8, das ist auch irgendwo in den Tiefen des Netzes festgehalten. Probleme entstehen dadurch, daß sich kaum jemand daran hält und lieber sein „eigenes Süppchen“ kocht.
Erschwerend kommt hinzu, daß es noch diverse andere Kodierungen gibt und, je nach eingestellten Systemkodierungen — also die, die auf dem Rechner als Standard voreingestellt oder vom Benutzer festgelegt sind —, diese dann die Zeichensätze unterschiedlich interpretieren. Einerseits beim Schreiben, andererseits beim Lesen.
utf16 soll in der Lage sein alle auf diesem Planeten verwendeten Schriftzeichen korrekt darzustellen, aber so lange die englischsprachige Welt auf ascii besteht den „Stein der Weisen“ zu besitzen, werden wir mit den Unzulänglichkeiten bei der Darstellung von nationalen Schriftbesonderheiten leben müssen.
Erschwerend kommt hinzu, daß es noch diverse andere Kodierungen gibt und, je nach eingestellten Systemkodierungen — also die, die auf dem Rechner als Standard voreingestellt oder vom Benutzer festgelegt sind —, diese dann die Zeichensätze unterschiedlich interpretieren. Einerseits beim Schreiben, andererseits beim Lesen.
utf16 soll in der Lage sein alle auf diesem Planeten verwendeten Schriftzeichen korrekt darzustellen, aber so lange die englischsprachige Welt auf ascii besteht den „Stein der Weisen“ zu besitzen, werden wir mit den Unzulänglichkeiten bei der Darstellung von nationalen Schriftbesonderheiten leben müssen.
Re: [git] das Umlaut-Problem
Das ist mir alles bewußt, aber erkärt nicht das konkrete Problem.
Welche Komponente (Linux, Dateisystem, git, bash, terminator, ...?) macht hier einen Fehler bzw. weicht vom Standard ab?
Welche Komponente (Linux, Dateisystem, git, bash, terminator, ...?) macht hier einen Fehler bzw. weicht vom Standard ab?
Re: [git] das Umlaut-Problem
Keine.MoonKid hat geschrieben:Welche Komponente (Linux, Dateisystem, git, bash, terminator, ...?) macht hier einen Fehler
Was ist denn der Standard? Das genau ist doch das Problem, es gibt tonnenweise Standards, um einen Umlaut wie "ä" zu kodieren.bzw. weicht vom Standard ab?
Dein Linux kodiert das "ä" als zwei Byte nach dem UTF-8 Standard ("\303\244" in oktaler Darstellung), und git zeigt alle Bytes des Dateinamens außer ASCII einfach stur-doof in Oktalform an, damit das plattformübergreifend funktioniert.
Re: [git] das Umlaut-Problem
Auch wenn es dir evtl. banal erscheint, ist deine Erklärung sehr hilfreich!
Bei meinem derzeitigen Verständnis müsste das hier reichen in der ~/.gitconfig
Aber natürlich funktioniert das nicht. Am output von git status ändert sich nix.
Bei meinem derzeitigen Verständnis müsste das hier reichen in der ~/.gitconfig
Code: Alles auswählen
[i18n]
logoutputencoding = UTF-8
Re: [git] das Umlaut-Problem
Das Internet ( http://stackoverflow.com/questions/7113 ... 97#7195597 ) meint, Du könntest es mal damit versuchen:
Code: Alles auswählen
[core]
quotepath = false
Re: [git] das Umlaut-Problem
Thanks. Hab zwei Suchmaschienen bedient. Vielleicht hätte ich das mal auf Englisch tun sollen!?