OCR für Tabellen

Einrichten des Druckers und des Drucksystems, Scannerkonfiguration und Software zum Scannen und Faxen.
Antworten
Kermit24
Beiträge: 317
Registriert: 29.04.2006 14:44:39

OCR für Tabellen

Beitrag von Kermit24 » 16.07.2010 14:43:05

Hallo,
ich nutze tesseract als OCR Software und bin damit auch ganz zufrieden. Nur habe ich es bis heute noch nicht hinbekommen Tabellen zu erkennen. Geht das auch mit tesseract oder gibt es vielleicht eine andere OCR-Software, die das kann?

TIA,
Kermit

guennid

Re: OCR für Tabellen

Beitrag von guennid » 30.07.2010 02:06:54

Ohne dass ich das wirklich weiß, behaupte ich mal: tesseract schafft keinerlei layout. Ich habe zuletzt vor Monaten/Jahren(?) gehört, dass daran gearbeitet wird, weiß aber nicht, was daraus geworden ist. Ich behelfe mich damit, dass ich in xsane ausschnittweise scanne. Außer tesseract gibt es meines Wissens keine benutzbare OCR-Software für linux.

Grüße, Günther

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: OCR für Tabellen

Beitrag von rendegast » 30.07.2010 03:39:44

Außer tesseract gibt es meines Wissens keine benutzbare OCR-Software für linux.
Abbyy Fine Reader, linux-generisch oder die den Scannern beiliegende Version in wine.
http://www.linux-magazin.de/NEWS/OCR-Ab ... fuer-Linux
http://www.abbyy.de/finereader_engine_linux/
EDIT:
Linux-Magazin 07/10, S.68, "Richtig gelesen? - Die Abbyy-OCR-Engine für Linux im Test":
v8.0: 150 Euro 12.000 Seiten/Jahr
v9.0 SDK: ab 4900 Euro für 3 Entwickler (Ups!)

http://www.linux-magazin.de/Heft-Abo/Au ... 3/Nachlese :
Tesseract (+Ocropus), Cuneiform
Insgesamt geht Cuneiform aus dem Vergleich als Sieger hervor. Außer bei in der Praxis häufigen Serifenschriften fällt der Vorsprung bei der reinen Zeichenerkennung nicht allzu deutlich aus.
http://www.vividata.com/be_xtr_overview.html

Omnipage 15 Capture SDK
http://www.nuance.com/imaging/products/omnipage.asp :
OmniPage 17 wohl nur für win + mac
Zuletzt geändert von rendegast am 03.08.2010 14:38:33, insgesamt 1-mal geändert.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

guennid

Re: OCR für Tabellen

Beitrag von guennid » 30.07.2010 08:59:23

Danke sehr! Wieder was gelernt.

Ocropus bisher nur in sid. Stimmt das?

Grüße, Günther

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: OCR für Tabellen

Beitrag von rendegast » 30.07.2010 14:08:15

mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Antworten