Alle Umlaute in einem Verzeichnis zu ä, etc?

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
Benutzeravatar
larus
Beiträge: 587
Registriert: 03.11.2003 13:11:12
Wohnort: Wil (Schweiz)
Kontaktdaten:

Alle Umlaute in einem Verzeichnis zu ä, etc?

Beitrag von larus » 13.03.2004 12:37:15

Ich bin drauf und dran, endlich mal Python zu lernen.
IIch arbeite an einer Homepage, und stosse immer auf Probleme, von denen ich weiss, dass sie etwa 2 Pythonzeilen benötigen.
Jetzt zum Beispiel: alle Umlaute in Html-Dateien in einem Verzeichnis zu standardgerechten Zeichen wie ö etc, umwandeln.
Ich wollte ein Bashskript machen à la:

Code: Alles auswählen

find -name *.html -exec grep -R ü > ü
, oder so.
Natürlich weiss ich nicht, wie ich das zum Funktionieren bringe.
Hat jemand eine Lösung? Ich wäre sehr dankbar.

Grüsse, larus
larus: die Mo:we

http://peter.l2p.net/ - Die Seite, die du brauchst.

keyem
Beiträge: 303
Registriert: 23.08.2002 07:50:28
Wohnort: Berlin

Beitrag von keyem » 13.03.2004 12:51:26

Vielleicht so in der Art:

Code: Alles auswählen

find -name *.html -exec sed "s/ü/ü/g" {} {}.neu\;
Viel Erfolg,
keyem

Benutzeravatar
larus
Beiträge: 587
Registriert: 03.11.2003 13:11:12
Wohnort: Wil (Schweiz)
Kontaktdaten:

Beitrag von larus » 13.03.2004 14:23:18

Vielen Dank für den Ansatz
Jetzt habe ich aber eine halbe Stunde rumgetüftelt aber nicht herausbekommen, wie ich die html-Dateien gleich direkt ersetzen kann, sodass keine neue Datei entsteht.
Ich hab's geschafft, leider aber nicht mit einer eigenen Lösung... ;-)
Ich fand das Script html-charset unter:
http://www.ensicaen.ismra.fr/~delvare/d ... ml-charset
, machte es ausführbar und kopierte es in einen suchpfad und machte ein:

Code: Alles auswählen

find -name *.html -exec html-charset encode '{}' ';'
in dem Homepage-Verzeichnis.
So werden alle (und nicht nur Umlaute) nicht konformen Zeichen in HTML-Codes umgewandelt! Einfach genial.

ggl, larus
larus: die Mo:we

http://peter.l2p.net/ - Die Seite, die du brauchst.

Antworten