Hallo,
ich bin auf der Suche nach einer Software, um gescannte Papierformulare auszuwerten.
Die Formularfelder sind an definierten Stellen angekreuzt, dies möchte ich erkennen und irgendwie speicheren.
Gruß,
configd
gescannte Formulare auswerten
Re: gescannte Formulare auswerten
Leider kenne ich keine vorgefertigte Lösung, hätte aber wohl eine Idee. Die würde jedoch voraussetzen, dass die Ankreuzfelder sich in der Bilddatei immer an den gleichen Stellen befinden. Ist das der Fall?
cu,
niemand
cu,
niemand
Re: gescannte Formulare auswerten
Als OCR-Schrifterkennung kannst du dir mal tesseract-ocr anschauen. Wird aber für dein Problem eher ungeeignet sein.
Re: gescannte Formulare auswerten
Ja, die Felder sind immer an der selben Stelle, geringe Abweichungen gibt es aber durch das Scannen.
Re: gescannte Formulare auswerten
Nur erst einmal zum Verständnis:
Reden wir von so etwas wie:
1) einer Checkliste, bei der schon fest steht, was an welchem Ort steht und Du willst z.B. nur wissen, ob etwas angekreuzt wurde
2) einem Text, in dem die Stellen, welche Du einlesen möchtest, am Rand mit einem x markiert sind
3) einem Formular, aus dem Du dort gemachte Angaben auslesen möchtest, wo auch ein Kreuz gesetzt wurde
Bei ersterem würde ich - vorausgesetzt und kannst ein ganz klein wenig in cpp Programmieren - vorschlagen, es einmal mit der opencv-Bibliothek zu versuchen. Eine Erkennung von einem Quadrat in einem vordefinierten Bereich eines Bildes für einen vordefinierten Farbbereich sollte schnell implementiert sein und dann müsste man nur noch festlegen, wie sehr der mittlere Wert der rgb's innerhalb von diesem von einem Referzenwert abweichen muss, damit er als angekreuzt gilt.
Reden wir von so etwas wie:
1) einer Checkliste, bei der schon fest steht, was an welchem Ort steht und Du willst z.B. nur wissen, ob etwas angekreuzt wurde
2) einem Text, in dem die Stellen, welche Du einlesen möchtest, am Rand mit einem x markiert sind
3) einem Formular, aus dem Du dort gemachte Angaben auslesen möchtest, wo auch ein Kreuz gesetzt wurde
Bei ersterem würde ich - vorausgesetzt und kannst ein ganz klein wenig in cpp Programmieren - vorschlagen, es einmal mit der opencv-Bibliothek zu versuchen. Eine Erkennung von einem Quadrat in einem vordefinierten Bereich eines Bildes für einen vordefinierten Farbbereich sollte schnell implementiert sein und dann müsste man nur noch festlegen, wie sehr der mittlere Wert der rgb's innerhalb von diesem von einem Referzenwert abweichen muss, damit er als angekreuzt gilt.
Re: gescannte Formulare auswerten
Und wenn dein C++ nicht besonders gut ist: opencv gibt es auch für viele andere Sprachen.
Re: gescannte Formulare auswerten
Stimmt, hab ich ganz vergessen. Python z.B.Liffi hat geschrieben:Und wenn dein C++ nicht besonders gut ist: opencv gibt es auch für viele andere Sprachen.
Re: gescannte Formulare auswerten
Java kann sowas nativ ist halt lahm dabei... Wenn er programmieren kann ist die Sprache da wahrscheinlich ziemlich wurst. Aber ich glaube, das das Problem sein wird, dass die Kästchen eben nicht ganz exakt immer an der gleichen stelle liegen und dass kreuzchen wider durchgestrichen worden sind.
rot: Moderator wanne spricht, default: User wanne spricht.