[gelöst] CSV-Reader

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
Benutzeravatar
Lirion
Beiträge: 318
Registriert: 11.04.2007 08:30:14
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Worms
Kontaktdaten:

[gelöst] CSV-Reader

Beitrag von Lirion » 19.11.2008 13:30:32

Moin,

ich suche ein gescheites Programm, was mir CSV ausliest. Ja, ich bin mir der Existenz von OpenOffice und Excel bewußt :) Tatsache ist aber, daß selbst OpenOffice (das in dieser Hinsicht besser reagiert) einen Spezialfall nicht abfängt:
In einer Firma hier wird ein "klassisches" CSV, also mit Semikolon als Trennzeichen, für eine Datenschnittstelle benötigt. Mindestens eine der Spalten dieses CSV trägt HTML mit inline-CSS, also weiteren Semikolons.

Das Ganze sieht praktisch so aus (das Format ist auch unumstößlich, da die Zielschnittstelle das so erwartet):

Code: Alles auswählen

Daten;Daten;"<h1>bla</h1><p style=""font-weight: bold; color: red;"">bla</p>";Daten;Daten
Und um DAS jetzt ohne ständiges Rumfuchteln mit sed oder anderen Tools gescheit zu debuggen, wäre ein ordentlicher CSV-Betrachter prima.

Gesuchte Betriebssysteme:
Debian (gerne auch Konsole, da dann per SSH nutzbar)
Windows (GUI, 2000/NT/XP/Vista)

Wenn da jemand ne Idee hat: dickes Danke schonmal vorweg ;)

[edit]:
Topic auf "gelöst" gesetzt.
Zuletzt geändert von Lirion am 21.11.2008 15:57:43, insgesamt 1-mal geändert.
[/size]

Benutzeravatar
nyami
Beiträge: 374
Registriert: 14.01.2003 13:30:28
Lizenz eigener Beiträge: GNU General Public License

Re: CSV-Reader

Beitrag von nyami » 19.11.2008 16:26:32

Also wenn Du, wie in Deinem Beispiel, Anführungszeichen (") als Feldtrenner verwendest, hat Openoffice da überhaupt kein Problem!? Habe Deine Daten problemlos importiert.

Sinnvoll wäre wohl, einige "richtige" Datensätz zu sehen.

Gruß
Sven
diverse Hardware...

Benutzeravatar
Lirion
Beiträge: 318
Registriert: 11.04.2007 08:30:14
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Worms
Kontaktdaten:

Re: CSV-Reader

Beitrag von Lirion » 19.11.2008 18:00:21

Nochmal: Ich hab's bereits mit OpenOffice und Excel versucht.
Der Feldtrenner double quota ist sogar standardmäßig eingestellt...

Ich werd mal ne Pseudozeile posten. Hold the line.

edit:
So ich bezweifle zwar daß dies mehr Erleuchtung bringt - aber hier isset:

Code: Alles auswählen

col1;col2;title;col4;price;col6;col7;variants;col10;col11
1234;1234567890;Pseudodatensatz 1;;666,00;;;"<p style=""font-family: sans-serif; font-size: 9pt;""><strong>Pseudo-Datensatz in Naturplastik, rosa</strong></p>  	<div style=""padding-left: 10px; padding-right: 10px;"">OM NOM NOM</div>";http://random-url.fu/bar.png;;
Ich habe hier natürlich jetzt Spaltennamen geändert und auch Spalten weggelassen - worauf's ankommt: Der HTML-Code ist wie oben bereits beschrieben so dadrin. MUSS auch, da läßt die eine Schnittstelle nicht mit sich reden.

PS:
Konnte das auch fehlerfrei importieren. Grmpf. Fortsetzung folgt.
[/size]

Benutzeravatar
Lirion
Beiträge: 318
Registriert: 11.04.2007 08:30:14
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Worms
Kontaktdaten:

Re: CSV-Reader

Beitrag von Lirion » 21.11.2008 15:56:59

So. Bevor das hier noch untergeht:
nyamis Nachbohren hat den gewünschten Erfolg gebracht. OpenOffice importiert das nämlich fehlerlos. Wenn man nun aber in der Artikelbeschreibung (der HTML-Text in obigem Beispiel) einzelne Anführungszeichen setzt, kommen die auch so im CSV raus - und jagen auch OpenOffice ins Bockshorn.
Da man aber in HTML keine " setzt sondern was anderes, ist das ein Fehler an anderer Stelle. Wie lang hab ich nu danach gesucht... gnarf.

Passiert halt, wenn Leute ohne Verständnis für die HTML-Welt an HTML-Code rumbasteln. da kannste Templates basteln und erklären wie du willst, da schleichen sich immer Fehler ein.

Damit hat sich auch das Topic erledigt, OpenOffice reicht (Excel nicht, wo doch Excel eigentlich das stärkere von beiden ist... hahaha). Und für Parsingoperationen schau ich mir eh mal das csvtool an.

thx nyami fürs Mitdenken ;)
[/size]

Antworten