pdf2word pdf2docx pdf converter

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
franky789
Beiträge: 3
Registriert: 21.09.2013 18:44:14

pdf2word pdf2docx pdf converter

Beitrag von franky789 » 21.09.2013 18:50:03

Hallo,
ich suche schon eine ganze weile nach einem Tool, auf shell ebene (ohne Grafik), das ich in meinem script benutzen kann um pdf's ( etwa 2000 ) in verschiedenen Unterordnern (bis zu 4 ebenen) in .docx um zu wandeln.
Leider fand ich nur Tools für "Windows" oder MAC, die aber auch keine "batch" Funktion, wie ich sie brauche, liefern.
Die PDF's sind nicht aufwendig gestaltet, ein paar Bilder Überschriften Text....
... gibt es denn nicht ein Tool wie pdf2docx oder so ...

Beim suchen in gogle wird man immer auf die "Windows" Tools umgerutet !?

Besten Dank im Voraus
Gruss Franky

Cae
Beiträge: 6349
Registriert: 17.07.2011 23:36:39
Wohnort: 2130706433

Re: pdf2word pdf2docx pdf converter

Beitrag von Cae » 21.09.2013 19:04:12

.docx ist ein proprietaeres Format, ich bezweifle, dass es freie Konverter dafuer gibt. Vielleicht kann man Debianlibreoffice-writer entsprechend anscripten, das koennte man headless in etwas wie Debianxvfb machen. Aber was ist der Grund fuer dein Vorhaben? Vielleicht gibt es einfach bessere Wege dafuer.

Willkommen im Forum! [Edit: nicht fuer Crossposter, siehe unten]

Gruss Cae
Zuletzt geändert von Cae am 22.09.2013 20:35:27, insgesamt 1-mal geändert.
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.

—Bruce Schneier

Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22451
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Re: pdf2word pdf2docx pdf converter

Beitrag von KBDCALLS » 21.09.2013 19:33:14

Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

schwedenmann
Beiträge: 5644
Registriert: 30.12.2004 15:31:07
Wohnort: Wegberg

Re: pdf2word pdf2docx pdf converter

Beitrag von schwedenmann » 21.09.2013 19:52:41

Hallo


Ich habe im Web das gefunden

http://forum.openoffice.org/en/forum/vi ... =7&t=17889

mfg
schwedenmann

wanne
Moderator
Beiträge: 7598
Registriert: 24.05.2010 12:39:42

Re: pdf2word pdf2docx pdf converter

Beitrag von wanne » 22.09.2013 02:57:15

Das kann egentlich nicht richtig funktionieren. PDF hat keine Formatierungszeichen, sondern setzt fest welche Zeile wo steht und wie die Buchstaben da aussehen. D.h. Mann kann natürlich eine docx z.B. mit Bildern des PDF erstellen. Aber vernünftg bearbeitbar wird das nicht. (Außnahme ist, wenn das PDF irgend welche Erweiterungen enthällt, dann kannst du dir aber auch gleich das Orginal docx geben lassen.) Auch sonst verstehe ich nicht, warum man das machen sollte. docx ist ein standard den sowieso nur Word beherrscht das so oder so keine Stapelverarbeitung kann, un auch nicht unter Linux läuft.
rot: Moderator wanne spricht, default: User wanne spricht.

uname
Beiträge: 12460
Registriert: 03.06.2008 09:33:02

Re: pdf2word pdf2docx pdf converter

Beitrag von uname » 22.09.2013 08:20:41

Ich wäre schon froh wenn das Ergebnis von pdftotext (Debianpoppler-utils) etwas besser wäre.

franky789
Beiträge: 3
Registriert: 21.09.2013 18:44:14

Re: pdf2word pdf2docx pdf converter

Beitrag von franky789 » 22.09.2013 18:26:02

Hallo,
besten dank für die Antworten.

Ich habe, wie schon geschrieben, mehrere grosse mehrseitige PDF Dokumente von 500 bis zu 2000 Seiten, die "nicht" mit Word erstellt wurde !
Nun, zur weiter Verarbeitung der einzelnen Dokumente hätte ich gerne Word genutzt, das aktuelle Word hat nun mal als Standard .docx, natürlich würde auch .doc gehen aber da bin ich mir nicht ganz sicher ob das ursprüngliche Format erhalten bleibt. Auf meinem MAC nutze ich "Cycle PDF Converter" der das super in .docx convertiert, leider taugt das tool nicht für eine batch Routine.

Das sollte es doch auch für Linux geben, halt für den Shell betrieb.

Benutzeravatar
Phineas
Beiträge: 355
Registriert: 20.06.2012 20:26:19

Re: pdf2word pdf2docx pdf converter

Beitrag von Phineas » 22.09.2013 20:00:53

Wen der Threadersteller wohl mit seiner Antwort ansprechen will?
Die Helfenden hier?
Oder dort:
http://www.linux-forum.de/pdf2word-pdf2 ... 54350.html
Oder dort:
http://www.pro-linux.de/forum/viewtopic ... highlight=
?
Überall die gleiche Antwort rein zu kopieren, finde ich ziemlich dreist.

wanne
Moderator
Beiträge: 7598
Registriert: 24.05.2010 12:39:42

Re: pdf2word pdf2docx pdf converter

Beitrag von wanne » 23.09.2013 00:20:20

franky789 hat geschrieben:Auf meinem MAC nutze ich "Cycle PDF Converter" der das super in .docx convertiert, leider taugt das tool nicht für eine batch Routine.
Der Fügt Bilder ein. (Oder Test in komischen Tabelle mit Absätzen an der Falschen stelle.) => Auch das was der produziert ist nicht besser bearbeitbar als das PDF.
Verstehe aber soweiso du den nicht nimmst. Für Word musst du die Dateien sowieso einzeln nutzen. Im übrigen ist das Standardformat von Word laut Microsoft OOXML (.docx) und ODF (.odt)
Ansosnten gibt's das shon angesprochene pdf2txt. txt macht word auch mit.
(Zumindest wenn du sowas machst:

Code: Alles auswählen

pdf2txt pdf.pdf | sed "s,$,\r,g" > out.txt
Sonst kannst du auch so machen:

Code: Alles auswählen

pdf2txt comp.pdf > comp.txt
libreoffice --headless --convert-to docx comp.txt
Aber das wird halt alles nicht schön.
rot: Moderator wanne spricht, default: User wanne spricht.

franky789
Beiträge: 3
Registriert: 21.09.2013 18:44:14

Re: pdf2word pdf2docx pdf converter

Beitrag von franky789 » 23.09.2013 14:16:43

Hallo wanne,

besten Dank.

...werd ich mal austesten.

Antworten