Konvertierungsmüll entfernen <84>

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
Benutzeravatar
xcomm
Beiträge: 804
Registriert: 21.09.2003 05:12:01
Wohnort: Europe
Kontaktdaten:

Konvertierungsmüll entfernen <84>

Beitrag von xcomm » 31.08.2009 15:35:52

Hi Gemeinde,

wie kann man in einer Textdatei derartige Zeichen erfassen um es zu ersetzen (z.B. im vi)?

Im vi sieht das ä so aus: cat -v sieht das ä-Zeichen so: Danke, xcomm

gms
Beiträge: 7798
Registriert: 26.11.2004 20:08:38
Lizenz eigener Beiträge: MIT Lizenz

Re: Konvertierungsmüll entfernen <84>

Beitrag von gms » 31.08.2009 21:44:20

Code: Alles auswählen

:%s/\%x84/ä/g
möglicherweise wäre es aber gscheiter, die Textdatei mit z.B iconv zu konvertieren

Gruß
gms

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: Konvertierungsmüll entfernen <84>

Beitrag von minimike » 31.08.2009 23:09:39

oder mit dos2unix
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

Benutzeravatar
xcomm
Beiträge: 804
Registriert: 21.09.2003 05:12:01
Wohnort: Europe
Kontaktdaten:

Re: Konvertierungsmüll entfernen <84>

Beitrag von xcomm » 01.09.2009 10:52:06

Hey gms und mini mike,

vielen Dank! :-)

Ist das dann ein Win/DOS cp-xxxx Zeichen?

Danke, xcomm

gms
Beiträge: 7798
Registriert: 26.11.2004 20:08:38
Lizenz eigener Beiträge: MIT Lizenz

Re: Konvertierungsmüll entfernen <84>

Beitrag von gms » 01.09.2009 11:40:39

xcomm hat geschrieben: Ist das dann ein Win/DOS cp-xxxx Zeichen?
bei der 850er Codepage ist das 'ä' unter 0x84 zu finden: http://de.wikipedia.org/wiki/Codepage_850

Gruß
gms

Benutzeravatar
xcomm
Beiträge: 804
Registriert: 21.09.2003 05:12:01
Wohnort: Europe
Kontaktdaten:

Re: Konvertierungsmüll entfernen <84>

Beitrag von xcomm » 01.09.2009 12:08:24

Hi gms,

danke für die Erklärung! :-)

Sorry, noch eine Frage zur vi-Suche. Warum suchen wir nach %x84 und nicht nach 0x84?

Danke, xcomm

gms
Beiträge: 7798
Registriert: 26.11.2004 20:08:38
Lizenz eigener Beiträge: MIT Lizenz

Re: Konvertierungsmüll entfernen <84>

Beitrag von gms » 01.09.2009 14:00:28

xcomm hat geschrieben:Warum suchen wir nach %x84 und nicht nach 0x84?
eigentlich suchen wir nach dem Zeichen, welches durch die Hexadezimalzahl 84 repräsentiertet wird :wink:
und für Zahlen des Hexadezimalsystems gibt es die verschiedensten Schreibweisen, z.B $84, 84h, 84hex,.. und eben auch 0x84
Damit das einzelne Zeichen mit dem hexadezimalen Wert 0x84 von der Zeichenkette "0x84" unterschieden werden kann, werden in Regular Expressions sogenannte Escapezeichen verwendet. Daher schaut das z.B bei Perl dann so aus: "/\x84/" oder beim vi halt "\%x84"

http://de.wikipedia.org/wiki/Escape-Sequenz

Gruß
gms

Benutzeravatar
xcomm
Beiträge: 804
Registriert: 21.09.2003 05:12:01
Wohnort: Europe
Kontaktdaten:

Re: Konvertierungsmüll entfernen <84>

Beitrag von xcomm » 02.09.2009 15:15:39

Hallo gms,

super - danke!

Regars, xcomm

Antworten