Mit OCR Foto zu Scan machen
Mit OCR Foto zu Scan machen
Liebes Forum,
Ich bin in der 12. Klasse und leider schicken mir immer wieder meine Lehrer ein Foto von einem Dokument(z. B. Seite eines Buches). Wenn man dass dann ausdruckt, entsteht bekannter weise ein graues Blatt Papier mit schlecht lesbaren Buchstaben. Um dies zu verhindern habe ich bis jetzt eine App für das Smartphone verwendet, was sehr umständlich ist. Zudem habe ich bei ihr auch datenschutzrechtliche Bedenken. Diese App verwendet OCR. Deshalb frage ich, ob es nicht auch ein Terminal Programm für Linux gibt oder Grafisches. Es zu kompilen sollte für mich auch kein Problem sein.
Vielen Dank schon einmal!
Ich bin in der 12. Klasse und leider schicken mir immer wieder meine Lehrer ein Foto von einem Dokument(z. B. Seite eines Buches). Wenn man dass dann ausdruckt, entsteht bekannter weise ein graues Blatt Papier mit schlecht lesbaren Buchstaben. Um dies zu verhindern habe ich bis jetzt eine App für das Smartphone verwendet, was sehr umständlich ist. Zudem habe ich bei ihr auch datenschutzrechtliche Bedenken. Diese App verwendet OCR. Deshalb frage ich, ob es nicht auch ein Terminal Programm für Linux gibt oder Grafisches. Es zu kompilen sollte für mich auch kein Problem sein.
Vielen Dank schon einmal!
- schorsch_76
- Beiträge: 2601
- Registriert: 06.11.2007 16:00:42
- Lizenz eigener Beiträge: MIT Lizenz
Re: Mit OCR Foto zu Scan machen
tesseract-ocr
https://packages.debian.org/bullseye/tesseract-ocr
https://github.com/tesseract-ocr/
https://github.com/tesseract-ocr/tesser ... ract.1.asc
Hab das auf der Console noch nicht selbst eingesetzt aber ich weis das einige Scan Software das als Backend für OCR nutzen kann.
https://packages.debian.org/bullseye/tesseract-ocr
https://github.com/tesseract-ocr/
https://github.com/tesseract-ocr/tesser ... ract.1.asc
Hab das auf der Console noch nicht selbst eingesetzt aber ich weis das einige Scan Software das als Backend für OCR nutzen kann.
-
- Beiträge: 721
- Registriert: 09.09.2014 18:33:22
- Lizenz eigener Beiträge: GNU Free Documentation License
Re: Mit OCR Foto zu Scan machen
Um den Text zu erkennen und in einer separaten Datei zu speichern, nimmt man das Konsolenprogramm tesseract-ocr.
Aufgerufen wird tesseract so:
(An "AUSGABEDATEI" hängt tesseract von selbst noch ein ".txt" an)
Wenn ich einen auf mehrere Bilder verteilten Text in eine Textdatei "füllen" will, packe ich die Bilddateien in ein eigenes Verzeichnis und starte eins simples Batch-Skript (die Ausgabedatei heißt dann "output.md"):
Als graphische Lösung gibt es das GTK-Programm ocrfeeder, das Text in Bild- und PDF-Dateien erkennen und separat oder als zusätzlichen Layer in einem PDF speichern kann. Ich persönlich bin mit der Konsole aber viel schneller unterwegs.
Aufgerufen wird tesseract so:
Code: Alles auswählen
tesseract -l deu BILDNAME.jpg AUSGABEDATEI
Wenn ich einen auf mehrere Bilder verteilten Text in eine Textdatei "füllen" will, packe ich die Bilddateien in ein eigenes Verzeichnis und starte eins simples Batch-Skript (die Ausgabedatei heißt dann "output.md"):
Code: Alles auswählen
for i in *.png;do tesseract $i $(basename $i .png);done
cat *.txt >output.md
rm *.txt
Re: Mit OCR Foto zu Scan machen
Mein Favorit ist gimagereader-gtk aus gimagereader als Gui für Tesseract. Falls die Erkennung nicht so gut ist wie erhofft: Bilder etwas aufbereiten, z.B. mit gimp den Kontrast anpassen, oder auf einen Farbkanal reduziert in s/w abspeichern etc
Re: Mit OCR Foto zu Scan machen
Wenns nur um Lesbarkeit geht: brightness hoch und dann nach schwarz weis konvertiere oder das gamma hoch drehen hilft auch schon sehr viel.
rot: Moderator wanne spricht, default: User wanne spricht.
Re: Mit OCR Foto zu Scan machen
Vielen Dank für die vielen Antworten!
Am besten passt wohl für mich mit imagemagic die Bilder zu konvertieren, denn ich möchte es mal eben schnell machen. Bei mir funktioniert am Besten der Befehlt:
Am besten passt wohl für mich mit imagemagic die Bilder zu konvertieren, denn ich möchte es mal eben schnell machen. Bei mir funktioniert am Besten der Befehlt:
Code: Alles auswählen
convert INPUT -brightness-contrast 30x80 -gamma 1 OUTPUT
Re: Mit OCR Foto zu Scan machen
Am Handy arbeiten ist natürlich nicht so schön, aber es gäbe (zumindest bei den Androiden in F-Droid sowieso) Xournal++ mit dem man sowohl direkt in die PDFs reinschreiben als auch jpgs in PDF konvertieren und dann bearbeiten kann. Dann muss man nicht mal mehr was ausdrucken und mit diesen aufladbaren Stiften kann man auf den Touchscreens da auch ziemlich schön reinarbeiten.
In Debian gibts das Programm (Xournal) auch, dann muss man nicht mal am Handybilschirm wurschteln, sondern kann das Bild direkt bearbeiten bzw. mit Notizen versehen und abspeichern.
In Debian gibts das Programm (Xournal) auch, dann muss man nicht mal am Handybilschirm wurschteln, sondern kann das Bild direkt bearbeiten bzw. mit Notizen versehen und abspeichern.
“Don't you think that if I were wrong, I'd know it?” (Dr. Sheldon Cooper)
XFCE: alt,steinhart,langweilig,immer noch da.
XFCE: alt,steinhart,langweilig,immer noch da.