pdf2word pdf2docx pdf converter
pdf2word pdf2docx pdf converter
Hallo,
ich suche schon eine ganze weile nach einem Tool, auf shell ebene (ohne Grafik), das ich in meinem script benutzen kann um pdf's ( etwa 2000 ) in verschiedenen Unterordnern (bis zu 4 ebenen) in .docx um zu wandeln.
Leider fand ich nur Tools für "Windows" oder MAC, die aber auch keine "batch" Funktion, wie ich sie brauche, liefern.
Die PDF's sind nicht aufwendig gestaltet, ein paar Bilder Überschriften Text....
... gibt es denn nicht ein Tool wie pdf2docx oder so ...
Beim suchen in gogle wird man immer auf die "Windows" Tools umgerutet !?
Besten Dank im Voraus
Gruss Franky
ich suche schon eine ganze weile nach einem Tool, auf shell ebene (ohne Grafik), das ich in meinem script benutzen kann um pdf's ( etwa 2000 ) in verschiedenen Unterordnern (bis zu 4 ebenen) in .docx um zu wandeln.
Leider fand ich nur Tools für "Windows" oder MAC, die aber auch keine "batch" Funktion, wie ich sie brauche, liefern.
Die PDF's sind nicht aufwendig gestaltet, ein paar Bilder Überschriften Text....
... gibt es denn nicht ein Tool wie pdf2docx oder so ...
Beim suchen in gogle wird man immer auf die "Windows" Tools umgerutet !?
Besten Dank im Voraus
Gruss Franky
Re: pdf2word pdf2docx pdf converter
.docx ist ein proprietaeres Format, ich bezweifle, dass es freie Konverter dafuer gibt. Vielleicht kann man libreoffice-writer entsprechend anscripten, das koennte man headless in etwas wie xvfb machen. Aber was ist der Grund fuer dein Vorhaben? Vielleicht gibt es einfach bessere Wege dafuer.
Willkommen im Forum! [Edit: nicht fuer Crossposter, siehe unten]
Gruss Cae
Willkommen im Forum! [Edit: nicht fuer Crossposter, siehe unten]
Gruss Cae
Zuletzt geändert von Cae am 22.09.2013 20:35:27, insgesamt 1-mal geändert.
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.
—Bruce Schneier
- KBDCALLS
- Moderator
- Beiträge: 22447
- Registriert: 24.12.2003 21:26:55
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Dortmund
-
Kontaktdaten:
Re: pdf2word pdf2docx pdf converter
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.
EDV ist die Abkürzung für: Ende der Vernunft
Bevor du einen Beitrag postest:
Kaum macht man ein Fenster auf, gehen die Probleme los.
EDV ist die Abkürzung für: Ende der Vernunft
Bevor du einen Beitrag postest:
- Kennst du unsere Verhaltensregeln
- Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.
-
- Beiträge: 5632
- Registriert: 30.12.2004 15:31:07
- Wohnort: Wegberg
Re: pdf2word pdf2docx pdf converter
Hallo
Ich habe im Web das gefunden
http://forum.openoffice.org/en/forum/vi ... =7&t=17889
mfg
schwedenmann
Ich habe im Web das gefunden
http://forum.openoffice.org/en/forum/vi ... =7&t=17889
mfg
schwedenmann
Re: pdf2word pdf2docx pdf converter
Das kann egentlich nicht richtig funktionieren. PDF hat keine Formatierungszeichen, sondern setzt fest welche Zeile wo steht und wie die Buchstaben da aussehen. D.h. Mann kann natürlich eine docx z.B. mit Bildern des PDF erstellen. Aber vernünftg bearbeitbar wird das nicht. (Außnahme ist, wenn das PDF irgend welche Erweiterungen enthällt, dann kannst du dir aber auch gleich das Orginal docx geben lassen.) Auch sonst verstehe ich nicht, warum man das machen sollte. docx ist ein standard den sowieso nur Word beherrscht das so oder so keine Stapelverarbeitung kann, un auch nicht unter Linux läuft.
rot: Moderator wanne spricht, default: User wanne spricht.
Re: pdf2word pdf2docx pdf converter
Ich wäre schon froh wenn das Ergebnis von pdftotext (poppler-utils) etwas besser wäre.
Re: pdf2word pdf2docx pdf converter
Hallo,
besten dank für die Antworten.
Ich habe, wie schon geschrieben, mehrere grosse mehrseitige PDF Dokumente von 500 bis zu 2000 Seiten, die "nicht" mit Word erstellt wurde !
Nun, zur weiter Verarbeitung der einzelnen Dokumente hätte ich gerne Word genutzt, das aktuelle Word hat nun mal als Standard .docx, natürlich würde auch .doc gehen aber da bin ich mir nicht ganz sicher ob das ursprüngliche Format erhalten bleibt. Auf meinem MAC nutze ich "Cycle PDF Converter" der das super in .docx convertiert, leider taugt das tool nicht für eine batch Routine.
Das sollte es doch auch für Linux geben, halt für den Shell betrieb.
besten dank für die Antworten.
Ich habe, wie schon geschrieben, mehrere grosse mehrseitige PDF Dokumente von 500 bis zu 2000 Seiten, die "nicht" mit Word erstellt wurde !
Nun, zur weiter Verarbeitung der einzelnen Dokumente hätte ich gerne Word genutzt, das aktuelle Word hat nun mal als Standard .docx, natürlich würde auch .doc gehen aber da bin ich mir nicht ganz sicher ob das ursprüngliche Format erhalten bleibt. Auf meinem MAC nutze ich "Cycle PDF Converter" der das super in .docx convertiert, leider taugt das tool nicht für eine batch Routine.
Das sollte es doch auch für Linux geben, halt für den Shell betrieb.
Re: pdf2word pdf2docx pdf converter
Wen der Threadersteller wohl mit seiner Antwort ansprechen will?
Die Helfenden hier?
Oder dort:
http://www.linux-forum.de/pdf2word-pdf2 ... 54350.html
Oder dort:
http://www.pro-linux.de/forum/viewtopic ... highlight=
?
Überall die gleiche Antwort rein zu kopieren, finde ich ziemlich dreist.
Die Helfenden hier?
Oder dort:
http://www.linux-forum.de/pdf2word-pdf2 ... 54350.html
Oder dort:
http://www.pro-linux.de/forum/viewtopic ... highlight=
?
Überall die gleiche Antwort rein zu kopieren, finde ich ziemlich dreist.
Re: pdf2word pdf2docx pdf converter
Der Fügt Bilder ein. (Oder Test in komischen Tabelle mit Absätzen an der Falschen stelle.) => Auch das was der produziert ist nicht besser bearbeitbar als das PDF.franky789 hat geschrieben:Auf meinem MAC nutze ich "Cycle PDF Converter" der das super in .docx convertiert, leider taugt das tool nicht für eine batch Routine.
Verstehe aber soweiso du den nicht nimmst. Für Word musst du die Dateien sowieso einzeln nutzen. Im übrigen ist das Standardformat von Word laut Microsoft OOXML (.docx) und ODF (.odt)
Ansosnten gibt's das shon angesprochene pdf2txt. txt macht word auch mit.
(Zumindest wenn du sowas machst:
Code: Alles auswählen
pdf2txt pdf.pdf | sed "s,$,\r,g" > out.txt
Code: Alles auswählen
pdf2txt comp.pdf > comp.txt
libreoffice --headless --convert-to docx comp.txt
rot: Moderator wanne spricht, default: User wanne spricht.
Re: pdf2word pdf2docx pdf converter
Hallo wanne,
besten Dank.
...werd ich mal austesten.
besten Dank.
...werd ich mal austesten.