Mit OCR Foto zu Scan machen

Du suchst ein Programm für einen bestimmten Zweck?
Antworten
xme
Beiträge: 7
Registriert: 31.08.2021 14:35:43

Mit OCR Foto zu Scan machen

Beitrag von xme » 31.08.2021 14:57:49

Liebes Forum,
Ich bin in der 12. Klasse und leider schicken mir immer wieder meine Lehrer ein Foto von einem Dokument(z. B. Seite eines Buches). Wenn man dass dann ausdruckt, entsteht bekannter weise ein graues Blatt Papier mit schlecht lesbaren Buchstaben. Um dies zu verhindern habe ich bis jetzt eine App für das Smartphone verwendet, was sehr umständlich ist. Zudem habe ich bei ihr auch datenschutzrechtliche Bedenken. Diese App verwendet OCR. Deshalb frage ich, ob es nicht auch ein Terminal Programm für Linux gibt oder Grafisches. Es zu kompilen sollte für mich auch kein Problem sein.
Vielen Dank schon einmal!

Benutzeravatar
schorsch_76
Beiträge: 2601
Registriert: 06.11.2007 16:00:42
Lizenz eigener Beiträge: MIT Lizenz

Re: Mit OCR Foto zu Scan machen

Beitrag von schorsch_76 » 31.08.2021 15:09:23

Debiantesseract-ocr
https://packages.debian.org/bullseye/tesseract-ocr
https://github.com/tesseract-ocr/
https://github.com/tesseract-ocr/tesser ... ract.1.asc

Hab das auf der Console noch nicht selbst eingesetzt aber ich weis das einige Scan Software das als Backend für OCR nutzen kann.

Korodny
Beiträge: 721
Registriert: 09.09.2014 18:33:22
Lizenz eigener Beiträge: GNU Free Documentation License

Re: Mit OCR Foto zu Scan machen

Beitrag von Korodny » 31.08.2021 15:19:10

Um den Text zu erkennen und in einer separaten Datei zu speichern, nimmt man das Konsolenprogramm Debiantesseract-ocr.

Aufgerufen wird tesseract so:

Code: Alles auswählen

tesseract -l deu BILDNAME.jpg AUSGABEDATEI
(An "AUSGABEDATEI" hängt tesseract von selbst noch ein ".txt" an)

Wenn ich einen auf mehrere Bilder verteilten Text in eine Textdatei "füllen" will, packe ich die Bilddateien in ein eigenes Verzeichnis und starte eins simples Batch-Skript (die Ausgabedatei heißt dann "output.md"):

Code: Alles auswählen

	for i in *.png;do tesseract $i $(basename $i .png);done
	cat *.txt >output.md
	rm *.txt
Als graphische Lösung gibt es das GTK-Programm Debianocrfeeder, das Text in Bild- und PDF-Dateien erkennen und separat oder als zusätzlichen Layer in einem PDF speichern kann. Ich persönlich bin mit der Konsole aber viel schneller unterwegs.

eggy
Beiträge: 3334
Registriert: 10.05.2008 11:23:50

Re: Mit OCR Foto zu Scan machen

Beitrag von eggy » 31.08.2021 15:53:00

Mein Favorit ist gimagereader-gtk aus Debiangimagereader als Gui für Tesseract. Falls die Erkennung nicht so gut ist wie erhofft: Bilder etwas aufbereiten, z.B. mit gimp den Kontrast anpassen, oder auf einen Farbkanal reduziert in s/w abspeichern etc

Benutzeravatar
smutbert
Beiträge: 8343
Registriert: 24.07.2011 13:27:39
Wohnort: Graz

Re: Mit OCR Foto zu Scan machen

Beitrag von smutbert » 31.08.2021 16:31:03

Mit grafischer Oberfläche gäbe es auch noch Debiangscan2pdf und Debianyagf

wanne
Moderator
Beiträge: 7569
Registriert: 24.05.2010 12:39:42

Re: Mit OCR Foto zu Scan machen

Beitrag von wanne » 31.08.2021 17:35:02

Wenns nur um Lesbarkeit geht: brightness hoch und dann nach schwarz weis konvertiere oder das gamma hoch drehen hilft auch schon sehr viel.
rot: Moderator wanne spricht, default: User wanne spricht.

xme
Beiträge: 7
Registriert: 31.08.2021 14:35:43

Re: Mit OCR Foto zu Scan machen

Beitrag von xme » 01.09.2021 17:26:53

Vielen Dank für die vielen Antworten!
Am besten passt wohl für mich mit imagemagic die Bilder zu konvertieren, denn ich möchte es mal eben schnell machen. Bei mir funktioniert am Besten der Befehlt:

Code: Alles auswählen

convert INPUT -brightness-contrast 30x80 -gamma 1 OUTPUT 

Benutzeravatar
Drache
Beiträge: 772
Registriert: 22.11.2009 05:49:55

Re: Mit OCR Foto zu Scan machen

Beitrag von Drache » 01.09.2021 17:44:28

Am Handy arbeiten ist natürlich nicht so schön, aber es gäbe (zumindest bei den Androiden in F-Droid sowieso) Xournal++ mit dem man sowohl direkt in die PDFs reinschreiben als auch jpgs in PDF konvertieren und dann bearbeiten kann. Dann muss man nicht mal mehr was ausdrucken und mit diesen aufladbaren Stiften kann man auf den Touchscreens da auch ziemlich schön reinarbeiten.

In Debian gibts das Programm (Xournal) auch, dann muss man nicht mal am Handybilschirm wurschteln, sondern kann das Bild direkt bearbeiten bzw. mit Notizen versehen und abspeichern.
“Don't you think that if I were wrong, I'd know it?” (Dr. Sheldon Cooper)
XFCE: alt,steinhart,langweilig,immer noch da.

Antworten