GNU/Linux >> LINUX-Kenntnisse >  >> Linux

gImageReader – Extrahieren Sie Text aus Bildern und PDFs unter Linux

gImageReader ist ein kostenloser Open-Source-PDF-Reader mit der Fähigkeit, Text aus Bildern und PDFs zu extrahieren. Es ist als einfaches Gtk/Qt-Frontend für Tesseract-OCR aufgebaut , eine Open-Source-OCR-Engine zum Erkennen von Texten und Mustern in Dokumenten und Bildern mithilfe von künstlicher Intelligenz .

An sich ist Tesseract ein Befehlszeilentool, das auf die Verwendung durch Linux-Benutzer beschränkt ist, die mit ihren Terminals ausreichend vertraut sind. Danke an gImageReader , kann jetzt jeder von der OCR-Effizienz der Engine profitieren.

gImageReader funktioniert durch Scannen von Texten aus PDF- oder Bilddateien in einer der verschiedenen Sprachen, die es dank der Existenz von Unicode-Zeichen unterstützt. Es verfügt über eine einfache, gut organisierte, anpassbare Benutzeroberfläche, über die Sie Rechtschreibprüfungen und Übersetzungsaufgaben durchführen können.

Funktionen in gImageReader

  • Kostenlose und Open-Source-Software. Quellcode auf GitHub verfügbar.
  • Verfügbar auf GNU/Linux- und Windows-Plattformen.
  • Designfähige Benutzeroberfläche mit vertrautem Bearbeitungslayout.
  • Importieren Sie PDF-Dokumente und Bilder von Datenträgern, Scangeräten, Screenshots und der Zwischenablage.
  • PDF-Dokumente aus hOCR-Dokumenten generieren.
  • Manuelle oder automatische Definition des Erkennungsbereichs.
  • Verarbeiten Sie mehrere Bilder und Dokumente in Stapeln.
  • Erkennen Sie hOCR-Dokumente oder einfachen Text.
  • Erkannter Text wird neben Bildern angezeigt.
  • Verarbeiten Sie den erkannten Text nach, einschließlich Rechtschreibprüfung.

gImageReader ist einfach zu bedienen und unterstützt das Arbeiten mit Softcopy-Dokumenten sowie Schnappschüssen von hochgeladenen Medien, z. Screenshots. Sie haben sogar die Möglichkeit, den Textbereich auszuwählen, der Sie interessiert, und nur den Text hinzuzufügen, den Sie benötigen. Letztendlich gImagereader fungiert sowohl als PDF-Reader als auch als Textextraktionstool. Blödes Zeug.

gImageReader unter Linux installieren

Um gImageReader zu verwenden In vollem Umfang müssen Sie Tesseract manuell installieren Sprachpakete, damit Sie Bilder und Dateien richtig analysieren können. Das Paket heißt „Tesseract-ocr-eng ‘ und ist über den Software-Manager in Debian verfügbar und Fedora Distributionen.

Wenn Sie Ubuntu ausführen , können Sie einfach den PPA hinzufügen und führen Sie den Installationsbefehl mit den folgenden Befehlen aus:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt update
$ sudo apt install gimagereader

Auf Debian , Fedora , und OpenSUSE über den Paketmanager installieren.

$ sudo apt install gimagereader     [On Debian]
$ sudo dnf install gimagereader     [On Fedora]
$ sudo zypper install gimagereader  [On OpenSuse]

Fühlen Sie sich nicht ausgeschlossen, wenn Sie Arch Linux verwenden oder eines seiner Derivate. Der AUR hat dich abgedeckt. Und wenn Sie die App lieber aus dem Quellcode neu erstellen möchten, finden Sie Anweisungen in ihrem GitHub-Repository-Wiki-Link.

Extrahieren Sie gedruckten Text aus Bildern? Sie können sogar Schnappschüsse von ausgewählten Bereichen mit Ihrem Telefon machen und auf Ihren Laptop hochladen. Noch cooler ist die mehrsprachige Unterstützung – die zwar nicht perfekt ist, aber bereits jetzt eine der besten Optionen in der Community ist.

gImageReader gehört zu den besten PDF-Readern in der Open-Source-Welt, insbesondere mit seiner OCR-Fähigkeit, also probieren Sie es aus und sehen Sie, wie es Ihnen gefällt.

Wie gewohnt können Sie Ihre Erfahrungen mit der App gerne mit uns teilen, falls Sie welche haben. Und um weitere Vorschläge im Kommentarbereich unten hinzuzufügen.


Linux
  1. So extrahieren Sie .gz- und .tar.gz-Dateien unter Linux

  2. Diagramme aus PDFs extrahieren?

  3. Wie verwende ich sched_getaffinity und sched_setaffinity in Linux von C aus?

  4. Wie extrahiert man Text mit OCR aus einem PDF unter Linux?

  5. Tools zum Extrahieren von Text aus Powerpoint PPTX unter Linux?

So erstellen Sie Verzeichnisse aus einer Textdatei unter Linux

So entfernen Sie ein Passwort aus einer PDF-Datei unter Linux

So extrahieren Sie E-Mail-Adressen aus einer Textdatei unter Linux

So erstellen Sie ein Video aus Bildern unter Linux

So extrahieren Sie Audio aus Video in Ubuntu und anderen Linux-Distributionen

So konvertieren Sie PDF in PNG-Bilder und zurück unter Linux