Hi,
gibt es ein Programm mit dem man in Form von BigData-Analytics diverse PDF-Dateien auswerten kann? Zum Beispiel um verschiedene Merkmale zu vergleichen? Z.B. Autoren, Themenschwerpunkte usw.
GIbt es sowas überhaupt?
Danke schonmal
OpenSource BigData-Analytics-Programm?
-
- Beiträge: 48
- Registriert: 06.03.2017 14:51:18
-
- Beiträge: 3
- Registriert: 12.09.2017 10:51:07
-
Kontaktdaten:
Re: OpenSource BigData-Analytics-Programm?
Interessante Frage - hat ja per se erstmal mit Big Data nichts zu tun, eher mit Text Mining. Wenn deine PDF's wohlstrukturiert sind, gibt es da verschiedene Produkte. Sind vom Format her die PDF's identisch?
- Lord_Carlos
- Beiträge: 5578
- Registriert: 30.04.2006 17:58:52
- Lizenz eigener Beiträge: GNU Free Documentation License
- Wohnort: Dänemark
Re: OpenSource BigData-Analytics-Programm?
Kann sein das ich da gerade ein paar Buzzwoerter durcheinander bringe, aber kann TensorFlow das vielleicht? https://www.tensorflow.org/
Code: Alles auswählen
╔═╗┬ ┬┌─┐┌┬┐┌─┐┌┬┐╔╦╗
╚═╗└┬┘└─┐ │ ├┤ │││ ║║
╚═╝ ┴ └─┘ ┴ └─┘┴ ┴═╩╝ rockt das Forum!
-
- Beiträge: 2049
- Registriert: 18.03.2012 21:13:42
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: OpenSource BigData-Analytics-Programm?
Ein Zusammenklickloesung findest du in KNIME [1]. In diesem findest du einen PDF-Node zum Lesen von PDF-Files.
[1] https://www.knime.com/knime-analytics-platform
Kommt halt darauf an was er genau machen moechte. Momentan klingt es mir aber eher nach etwas, was er auch mit einer Tabellenkalkulation und einem pdf-parser machen koennte. Mit Tensorflow kann er natuerlich mehr machen, muss allerdings "programmieren".Lord_Carlos hat geschrieben:13.09.2017 12:44:06Kann sein das ich da gerade ein paar Buzzwoerter durcheinander bringe, aber kann TensorFlow das vielleicht? https://www.tensorflow.org/
[1] https://www.knime.com/knime-analytics-platform
Hilf mit unser Wiki zu verbessern!
-
- Beiträge: 3
- Registriert: 12.09.2017 10:51:07
-
Kontaktdaten:
Re: OpenSource BigData-Analytics-Programm?
naja, tensorflow ist ja eher eine machine lerning Lösung für universelle Aufgaben für die z.B. Bildanalyse .. KFZ-Nummernschilderkennung auf Bildern oder was auch immer.. Sein Frage ja nicht so generischer Natur, um zu den Text an sich zu erkennen sondern eher die semantische Analyse..
Dass Knime einen PDF-Reader hat, war mir noch gar nicht bewusst - sehr gut, vielen dank für den Hinweis! Das sollte ich mir unbedingt mal ansehen
Dass Knime einen PDF-Reader hat, war mir noch gar nicht bewusst - sehr gut, vielen dank für den Hinweis! Das sollte ich mir unbedingt mal ansehen
-
- Beiträge: 2049
- Registriert: 18.03.2012 21:13:42
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: OpenSource BigData-Analytics-Programm?
Hier gibt es noch ein, von mir nicht getestetes, Beispiel zum Downloaden[1].
[1] https://www.knime.com/forum/knime-users ... mment-6046
[1] https://www.knime.com/forum/knime-users ... mment-6046
Hilf mit unser Wiki zu verbessern!