8859-1(5) -> utf-8 - SZ Problem

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
Benutzeravatar
xcomm
Beiträge: 804
Registriert: 21.09.2003 05:12:01
Wohnort: Europe
Kontaktdaten:

8859-1(5) -> utf-8 - SZ Problem

Beitrag von xcomm » 26.08.2007 09:23:09

Hi Gemeinde,

ich habe den oft beschriebene Weg der Konvertierung mit iconv auf eine .sql angewendet.

Code: Alles auswählen

file foo.sql 
  foo.sql: ascii text
 iconv -f iso-8859-1 -t utf-8 foo.sql > foo.utf8.sql
Allerdings verbleibt mir ein klitzekleines Problem (neben den allgemein unausgegorenen Charakter die Charsetdinge).

Iconv tauschte brav ä ö ü aber verweigert oder vertut sich aber bei dem *vermaldeiten* ß (sz).
Ich habe des öfteren das Wort Größe in einer Beschreibung stehen, dort ist das ö in UTF-8 konvertiert, das ß aber in das folgende.

Soweit ich das sehe sollte dies rauskommen:

Code: Alles auswählen

Ã~CÅž
Drin drin steht aber:

Code: Alles auswählen

Ã~CÂ~_
Wie kann ich das irgendwie gegeneinander ersetzen - war bisher weder mit sed noch mysql erfolgreich diese Zeichen zu fassen?

Vielen Dank! xcomm


BTW: Noch eine Nebenfrage - mysqlclient - wie bringe ich dem UTF-8 bei?

Antworten