OCR:Optical Character Recognition
Allgemeines
Wikipedia über Texterkennung
Auswahlkriterien
- Open Source mit Platform Linux
- Kommandozeilenschnittstelle
- Eingabe Formate wie pbm , png, jpg usw.
Methoden
- OpenFST
- gewichtete endliche Zustandsautomaten
Produkte
JOCR (war GOCR)
- http://www.gocr.de/ JOCR-Homepage
- JOCR bei Wikipedia
Merkmale:
- ohne umfangreiche Erkennungsbibliothek
- Programmiersprache C
CuneiForm
Vergleiche
- Linux OCR Software Comparison
- Mathis Dirksen-Thedens: "How to scan and OCR like a pro with open source tools"
Verbesserungen
- pagetools
- Findet Drehungen ???
- unpaper
-
- findet und beseitigt Drehungen
Informatik- und Netzwerkverein Ravensburg e.V
Rudolf Weber