Datei-Informationen aus Worddateien auslesen

Vom einfachen Programm zum fertigen Debian-Paket, Fragen rund um Programmiersprachen, Scripting und Lizenzierung.
Antworten
fiberkill
Beiträge: 221
Registriert: 28.03.2007 09:08:30

Datei-Informationen aus Worddateien auslesen

Beitrag von fiberkill » 16.12.2010 11:08:20

Hallo zusammen,
ich habe nach einer Datenwiederherstellung ein Reihe von Worddatein, die keinen Sinnvollen Namen haben.
Ich möchte nun die Datei-Informationen per shellskript auslesen und die Dateien entsprechend umbenennen.
Kann man per Shellskript die Dateiinformationan aus Word- bzw. Officedokumenten (xls, ppt) auslesen ?

Bei .jpg Dateien hab ich das anhand der Exif-Daten der Fotos gemacht. Wäre super, wenn das bei Worddokumenten auch ginge.

Gruß fk

gbotti
Beiträge: 846
Registriert: 16.07.2010 14:24:43
Wohnort: München

Re: Datei-Informationen aus Worddateien auslesen

Beitrag von gbotti » 16.12.2010 11:58:57

Hi,

mit Debiancatdoc kann man die FileInformationen auslesen, jedoch befürchte ich, dass Word den Dateinamen nicht in den Info's abspeichert...

Beispiel:

Code: Alles auswählen

ox-replace:~# catdoc Testdokument.doc -v | head -n 10
File Info block version 193
Found at file offset 128 (hex 80)
Written by product version 89
Language 1031
This is document (DOC) file
File uses extended character set
File created on Windows
Using default character set
Textstart = 1024 (hex 400)
Textlen =   557 (hex 22d)
Nach diesen Info's kommt gleich der Text aus dem Worddokument...
mit Debianantiword hab ich das auch versucht, jedoch bekommt man da nur eine formatierte oder nicht formatierte Ausgabe des Dokuments.
Georg
RTFM, LMGTFY, Orakel... Ach... Warum muss man suchen...
Schrödingers Backup --- "Der Zustand eines Backups ist unbekannt, solange man es nicht wiederherstellt" --- Quelle: Nixcraft

fiberkill
Beiträge: 221
Registriert: 28.03.2007 09:08:30

Re: Datei-Informationen aus Worddateien auslesen

Beitrag von fiberkill » 16.12.2010 15:19:29

Vielen Dank für die Hilfe,
hat sich erledigt.

gbotti
Beiträge: 846
Registriert: 16.07.2010 14:24:43
Wohnort: München

Re: Datei-Informationen aus Worddateien auslesen

Beitrag von gbotti » 16.12.2010 15:39:25

Hast Du eine andere Lösung gefunden?
Wäre schön, wenn wir die erfahren dürften.
Georg
RTFM, LMGTFY, Orakel... Ach... Warum muss man suchen...
Schrödingers Backup --- "Der Zustand eines Backups ist unbekannt, solange man es nicht wiederherstellt" --- Quelle: Nixcraft

Antworten