Es gibt eine Reihe von OCR-Lesegeräten für Linux, die Bilder in Text umwandeln können. Sehen Sie sich die folgenden Optionen an:
- GOCR:Wikipedia-Seite
- Ocrad:Wikipedia-Seite
- Ocropus:Wikipedia-Seite
- tesseract-ocr:Wikipedia-Seite
Alle oben genannten, außer Ocropus, sind im Ubuntu-Repository in einem gleichnamigen Paket vorhanden.
Unterschiedliche Lesegeräte unterstützen unterschiedliche Bildformate, sodass Ihre Optionen möglicherweise durch das Dateiformat Ihres Dokuments eingeschränkt sind. Alternativ können Sie das Konvertierungstool von ImageMagick verwenden, um das Format zu ändern, wenn Sie ein bestimmtes OCR-Lesegerät verwenden möchten.
Angepasst von meiner Antwort hier.