Hallo,
OCR,Xsane, Spalten, wer hat Erfahrung? Die Ergebnisse mit gocr sind miserable. Gescannt habe ich nach Linien, Einstellung 300 (CanoScan N1240U). Gepeichert als Text und jpeg. Die Texterkennung ist eher miserable. Ausserdem handelt es sich um ein Buch. Jede Seite 2-spaltig. Musste hintereinander jede Spalte dran nehmen. Gäbe es ein anderer Weg?
Gruß
OCR,Xsane, Spalten, wer hat Erfahrung?
Re: OCR,Xsane, Spalten, wer hat Erfahrung?

Grüße, Günther
- KBDCALLS
- Moderator
- Beiträge: 22460
- Registriert: 24.12.2003 21:26:55
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: Dortmund
-
Kontaktdaten:
Re: OCR,Xsane, Spalten, wer hat Erfahrung?
Als Pdf abspeichern und OCRmyPDF drüber. Hab übrigens gerade mal ne c't Seite gescannt und Tesseract 3.04.01 . War mit Sprachangaben fehlerfrei.
Macht man das nicht werden Umlaute nicht richtig gelesen. Beim ü kommen dann zwei ii raus.
Code: Alles auswählen
tesseract -l deu out0011.tiff out2
Macht man das nicht werden Umlaute nicht richtig gelesen. Beim ü kommen dann zwei ii raus.
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.
EDV ist die Abkürzung für: Ende der Vernunft
Bevor du einen Beitrag postest:
Kaum macht man ein Fenster auf, gehen die Probleme los.
EDV ist die Abkürzung für: Ende der Vernunft
Bevor du einen Beitrag postest:
- Kennst du unsere Verhaltensregeln
- Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.