GNU/Linux >> LINUX-Kenntnisse > >> Linux

Diagramme aus PDFs extrahieren?

Ich habe eine Situation, in der ich Bilder aus vielen PDF-Dateien extrahieren und auf einer Website anzeigen muss. Meine PDFs enthalten „normale“ Bilder sowie viele Grafiken.

Ich habe pdf2xml verwendet und es zieht die Bilder in den Formaten jpeg, ppm, pbm und vec heraus. Ich sehe, dass die „normalen“ Bilder (größtenteils) als jpeg/ppm/pbm extrahiert werden, aber ich sehe nicht, dass die Grafiken dort sind – und daher vermute ich, dass pdf2xml sie als .vec-Dateien speichert.

Die Frage ist also, wie bekomme ich meine Grafiken? Ich habe convert verwendet das kommt mit imagemagick, um .vec in jpeg/png usw. umzuwandeln, aber ohne Erfolg.

Akzeptierte Antwort:

Ich habe pdf2xml noch nie ausprobiert, aber beim Durchsuchen seiner Dateien auf SourceForge fand ich vec2svg-2.py, das ein Python-Skript zu sein scheint, um .vec-Dateien in .svg zu konvertieren. Sie sollten keine Schwierigkeiten haben, SVG in das gewünschte Format zu konvertieren.

python vec2svg-2.py -i file.vec -o file.svg

Linux – Zeile nur drucken, wenn Zahl im dritten Feld größer als X ist?

Wie überwacht man eine serielle Verbindung bei 250000 Baud?

Linux

So erstellen Sie eine Montage aus Bildern unter Linux

So extrahieren Sie E-Mail-Adressen aus einer Textdatei unter Linux

So erstellen Sie ein Video aus Bildern unter Linux

Extrahieren Sie eine einzelne Datei aus einer riesigen TGZ-Datei

Befehlszeile:Substring aus der Ausgabe extrahieren

Zeilen von unten extrahieren, bis Regex übereinstimmt