Hallo!
Ich suche ein Programm, mit dem ich PDF-Dateien mit gleichem Inhalt finden kann.
Mein erster Gedanke war fdupes/md5sum zu verwenden, blöderweise sind die Dateien trotz gleichen Inhalts nicht Byte-für-Byte gleich (Meta-Informationen wie der Titel sind z.B. anders).
Ich bräuchte also etwas, das nur den Inhalt vergleicht. Nur gleicher Text sollte in meinem Fall reichen.
Grüsse
Das Accelerometer.
PDF-Dateien mit äquivalentem Inhalt finden
- Accelerometer
- Beiträge: 168
- Registriert: 31.01.2009 17:03:13
- Lizenz eigener Beiträge: GNU Free Documentation License
PDF-Dateien mit äquivalentem Inhalt finden
"Ich bin ein Gegner der Religion. Sie lehrt uns, damit zufrieden zu sein, dass wir die Welt nicht verstehen."
-- Richard Dawkins, "Der Gotteswahn"
-- Richard Dawkins, "Der Gotteswahn"
Re: PDF-Dateien mit äquivalentem Inhalt finden
Hallo,
Du kannst die Datei zunächst mit:
wandeln und diese dann nach Bedarf analysieren.
Gruß
Matthias
Du kannst die Datei zunächst mit:
Code: Alles auswählen
pdftotext -layout datei.pdf datei.txt
Gruß
Matthias
- Accelerometer
- Beiträge: 168
- Registriert: 31.01.2009 17:03:13
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: PDF-Dateien mit äquivalentem Inhalt finden
Ok, so weit war ich auch schon
"Ich bin ein Gegner der Religion. Sie lehrt uns, damit zufrieden zu sein, dass wir die Welt nicht verstehen."
-- Richard Dawkins, "Der Gotteswahn"
-- Richard Dawkins, "Der Gotteswahn"
Re: PDF-Dateien mit äquivalentem Inhalt finden
Hi,
ich habe auchmal sowas gesucht, bin aber immer nur auf Windows Bezahlware gestossen, fuer Linux habe ich auch nichts gefunden.
ich habe auchmal sowas gesucht, bin aber immer nur auf Windows Bezahlware gestossen, fuer Linux habe ich auch nichts gefunden.
Roland
"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"
"Aber wenn du schon so unwissend bist, davon noch nicht gehört zu haben,
so will ich es doch als gut ansehen, daß du lieber einmal töricht fragst,
als weiterhin nichts von etwas zu wissen, das man doch wissen sollte."
aus "Die Edda des Snorri Sturluson", "Gylfis Täuschung"
Re: PDF-Dateien mit äquivalentem Inhalt finden
Hallo,
Hat Dich das denn bei Deiner Problemlösung weitergebracht?
Gruß
Matthias
Das ist schön aber erst mal nur die Voraussetzung für den Textvergleich.Ok, so weit war ich auch schon
Hat Dich das denn bei Deiner Problemlösung weitergebracht?
Gruß
Matthias