[gefunden] Dateien umbenennen ISO8815 -> UTF8

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Benutzeravatar
peschmae
Beiträge: 4844
Registriert: 07.01.2003 12:50:33
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: nirgendwo im irgendwo

[gefunden] Dateien umbenennen ISO8815 -> UTF8

Beitrag von peschmae » 30.04.2006 13:21:12

Ist mir gerade über den Weg gelaufen und dürfte wohl anderen auch noch nützlich sein die nichts schlaueres zu tun haben als ihr Debian System von ISO8815-1 nach UTF8 oder so umzustellen.

Da passierts ja dass Umlaute in Dateinamen nachher voll verkehrt daherkommen. Zum geradebiegen gibts ein cooles kleines Tool:

Code: Alles auswählen

convmv -f latin-1 -t UTF-8 /home
natürlich zu finden im Paket convmv :)

MfG Peschmä
"er hätte nicht in die usa ziehen dürfen - die versauen alles" -- Snoopy

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 30.04.2006 13:28:55

Das Tool ist mir bekannt, aber gibt es auch ein "intelligenteres"?

Mein Problem mit dem Tool war, dass ich teilweise unterschiedlich codierte Dateinamen auf derselben Partition hatte und wenn man alle konvertiert, dann bleibt das Durcheinander erhalten, nur umgedreht.

Schön wäre ein Tool, das die aktuelle Codierung ermittelt und nur konvertiert, wenn ein Dateiname noch nicht im Zielformat codiert ist.

Kennt jemand sowas?

Gruß
puntarenas

Benutzeravatar
peschmae
Beiträge: 4844
Registriert: 07.01.2003 12:50:33
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: nirgendwo im irgendwo

Beitrag von peschmae » 30.04.2006 13:44:23

Eigentlich sollte convmv das automatisch erkennen. Aber irgendwie funktioniert das nicht :D

Überrascht mich auch nicht - ich kann mir nicht vorstellen wie sowas gehen sollte - ich meine auch im besten Fall bliebe sowas ein Ratespielchen...

MfG Peschmä
"er hätte nicht in die usa ziehen dürfen - die versauen alles" -- Snoopy

Benutzeravatar
puntarenas
Beiträge: 712
Registriert: 28.05.2005 15:07:05

Beitrag von puntarenas » 30.04.2006 14:15:26

peschmae hat geschrieben:Überrascht mich auch nicht - ich kann mir nicht vorstellen wie sowas gehen sollte - ich meine auch im besten Fall bliebe sowas ein Ratespielchen...
Im allerbesten Fall bliebe es aber ein Ratespielchen mit minimaler Fehlerquote. Bei Problemfällen dürft mein Traumtool auch gerne rückfragen, ich wäre dann bereit selbstlos zu helfen :D

Aber du hast natürlich Recht, trivial wäre so eine Erkennung vermutlich nicht und in aller Regel leistet convmv ja auch ausgezeichnete Arbeit...

Benutzeravatar
DonSam
Beiträge: 118
Registriert: 02.05.2005 21:55:31
Kontaktdaten:

Beitrag von DonSam » 30.04.2006 14:16:42

Hey, das ist ja Prima!

Kurze Frage: was gehört denn alles zur vollständigen Umstellung auf UTF-8?

Reicht es die locales umzustellen? Momentan schauts bei mir nämlich noch so aus:

Code: Alles auswählen

LANG=de_DE@euro
LC_CTYPE="de_DE@euro"
LC_NUMERIC="de_DE@euro"
LC_TIME="de_DE@euro"
LC_COLLATE="de_DE@euro"
LC_MONETARY="de_DE@euro"
LC_MESSAGES="de_DE@euro"
LC_PAPER="de_DE@euro"
LC_NAME="de_DE@euro"
LC_ADDRESS="de_DE@euro"
LC_TELEPHONE="de_DE@euro"
LC_MEASUREMENT="de_DE@euro"
LC_IDENTIFICATION="de_DE@euro"
LC_ALL=
Gruß
Sam

Geisel Gangsta
Beiträge: 173
Registriert: 27.09.2004 08:25:52
Wohnort: Brühl

Beitrag von Geisel Gangsta » 30.04.2006 20:22:50

Da es hier gerade um Dateinamen und Umlaute geht, möchte ich mal eine Frage dazu stellen.
Habe in meiner /etc/environment nun alle Variablen auf "de_DE.UTF-8" stehen. Wo kann ich denn überhaupt nachlesen welche Zeichen innerhalb des Dateinamens erlaubt sind, also so eine Art Dateinamenkonvention? Hauptsächlich geht es mir dabei um Umlaute und Sonderzeichen. Oder hat das vielleicht auch was mit dem Dateisystem zu tun?

stockfisch
Beiträge: 57
Registriert: 11.06.2005 12:16:19
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von stockfisch » 30.04.2006 21:05:18

wenn du utf-8 benutzt, kannst du quasi alle sonderzeichen benutzen, denn dann sind es keine richtigen sonderzeichen mehr ;) .. ganz nach deinem belieben sind dann auch chinesische schriftzeichen erlaubt ..

schönes restwochenende
><(((*>

Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22456
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Beitrag von KBDCALLS » 30.04.2006 21:12:16

puntarenas hat geschrieben:
peschmae hat geschrieben:Überrascht mich auch nicht - ich kann mir nicht vorstellen wie sowas gehen sollte - ich meine auch im besten Fall bliebe sowas ein Ratespielchen...
I
Aber du hast natürlich Recht, trivial wäre so eine Erkennung vermutlich nicht und in aller Regel leistet convmv ja auch ausgezeichnete Arbeit...
Nach der Beschreibung sollte das aber funktionieren.

Code: Alles auswählen

Beschreibung: filename encoding conversion tool
 convmv can convert a single filename, a directory tree or all files on a filesystem to a different encoding. It only converts the encoding of
 filenames, not files contents. A special feature of convmv is that it also takes care of symlinks: the encoding of the symlink's target will
 be converted if the symlink itself is being converted.

 It is also possible to convert directories to UTF-8 which are already partially UTF-8 encoded.
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

Benutzeravatar
peschmae
Beiträge: 4844
Registriert: 07.01.2003 12:50:33
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: nirgendwo im irgendwo

Beitrag von peschmae » 30.04.2006 22:12:22

Ja, wie schon gesagt - es geht angeblich. Faktisch gehts aber nicht.

Ich hatte vorhin aus versehen einen Ordner zweimal "konvertiert" - das war einmal zuviel. Wieder einmal zurück und gut war :)

Von funktionierender heuristik nichts zu sehen ;)

MfG Peschmä
"er hätte nicht in die usa ziehen dürfen - die versauen alles" -- Snoopy

Benutzeravatar
blueflidge
Beiträge: 1414
Registriert: 31.01.2005 10:16:49
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: bei Bonn

Beitrag von blueflidge » 10.10.2006 06:47:19

Gibt es für Windows eigentlich ein Programm, was ähnliches tut?
Nen Kollege hat gemeint, dass er wieder zu Win wechseln muss und jetzt hat er alle seine Umlaute als Sonderzeichen da stehen... Ì Ì Ì
Es wäre natürlich schlau gewesen, vor dem Abstieg von Suse nach Windows die Konvertierung wieder rückgängig zu machen
Beste Grüße
Tamara
The Debian Women Project

Benutzeravatar
blueflidge
Beiträge: 1414
Registriert: 31.01.2005 10:16:49
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: bei Bonn

Beitrag von blueflidge » 11.10.2006 12:58:57

Niemand eine Idee?
Beste Grüße
Tamara
The Debian Women Project

elfboi
Beiträge: 71
Registriert: 09.12.2005 21:26:37
Kontaktdaten:

Beitrag von elfboi » 22.01.2007 21:03:27

Ich dachte, Windoof verwendet seit 2k auch Unicode... ich habe auf meinem Hauptrechner Linux und W2k parallel, und wenn ich mich recht erinnere, hatte ich mal einige japanische Anime auf einer NTFS-Partition, bei denen die japanischen Zeichen im Dateinamen korrekt dargestellt wurden.

Wenn ich irgendwo gezwungen bin, Windoof zu installieren (wenn, dann meist eh nur für Spiele und proprietären Kram wie die Software für mein Handy), dann installiere ich aber auch immer die Unterstützung für sämtliche Sprachen. Es mag sein, daß es immer noch ISO statt UTF-8 verwendet, wenn man das nicht tut.

Benutzeravatar
blueflidge
Beiträge: 1414
Registriert: 31.01.2005 10:16:49
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: bei Bonn

Beitrag von blueflidge » 22.01.2007 22:03:59

Ich hab immer das Problem, wenn ich unter Debian auf meine Windowspartition zugreife werden Umlaute als Murks dargestellt
Beste Grüße
Tamara
The Debian Women Project

elfboi
Beiträge: 71
Registriert: 09.12.2005 21:26:37
Kontaktdaten:

Beitrag von elfboi » 24.01.2007 12:06:33

salnet hat geschrieben:Ich hab immer das Problem, wenn ich unter Debian auf meine Windowspartition zugreife werden Umlaute als Murks dargestellt
Hast du in der /etc/fstab die Parameter richtig eingetragen? Wenn dein Windoze kein UTF-8 verwendet, mußt du die Zeichencodierung angeben.

Antworten