Hallo,
ich nutze tesseract als OCR Software und bin damit auch ganz zufrieden. Nur habe ich es bis heute noch nicht hinbekommen Tabellen zu erkennen. Geht das auch mit tesseract oder gibt es vielleicht eine andere OCR-Software, die das kann?
TIA,
Kermit
OCR für Tabellen
Re: OCR für Tabellen
Ohne dass ich das wirklich weiß, behaupte ich mal: tesseract schafft keinerlei layout. Ich habe zuletzt vor Monaten/Jahren(?) gehört, dass daran gearbeitet wird, weiß aber nicht, was daraus geworden ist. Ich behelfe mich damit, dass ich in xsane ausschnittweise scanne. Außer tesseract gibt es meines Wissens keine benutzbare OCR-Software für linux.
Grüße, Günther
Grüße, Günther
Re: OCR für Tabellen
Abbyy Fine Reader, linux-generisch oder die den Scannern beiliegende Version in wine.Außer tesseract gibt es meines Wissens keine benutzbare OCR-Software für linux.
http://www.linux-magazin.de/NEWS/OCR-Ab ... fuer-Linux
http://www.abbyy.de/finereader_engine_linux/
EDIT:
Linux-Magazin 07/10, S.68, "Richtig gelesen? - Die Abbyy-OCR-Engine für Linux im Test":
v8.0: 150 Euro 12.000 Seiten/Jahr
v9.0 SDK: ab 4900 Euro für 3 Entwickler (Ups!)
http://www.linux-magazin.de/Heft-Abo/Au ... 3/Nachlese :
Tesseract (+Ocropus), Cuneiform
http://www.vividata.com/be_xtr_overview.htmlInsgesamt geht Cuneiform aus dem Vergleich als Sieger hervor. Außer bei in der Praxis häufigen Serifenschriften fällt der Vorsprung bei der reinen Zeichenerkennung nicht allzu deutlich aus.
Omnipage 15 Capture SDK
http://www.nuance.com/imaging/products/omnipage.asp :
OmniPage 17 wohl nur für win + mac
Zuletzt geändert von rendegast am 03.08.2010 14:38:33, insgesamt 1-mal geändert.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
Re: OCR für Tabellen
Danke sehr! Wieder was gelernt.
Ocropus bisher nur in sid. Stimmt das?
Grüße, Günther
Ocropus bisher nur in sid. Stimmt das?
Grüße, Günther
Re: OCR für Tabellen
http://packages.debian.org/Ocropus
sid + squeeze
sid + squeeze
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")