GNU/Linux >> LINUX-Kenntnisse >  >> Linux

Diagramme aus PDFs extrahieren?

Ich habe eine Situation, in der ich Bilder aus vielen PDF-Dateien extrahieren und auf einer Website anzeigen muss. Meine PDFs enthalten „normale“ Bilder sowie viele Grafiken.

Ich habe pdf2xml verwendet und es zieht die Bilder in den Formaten jpeg, ppm, pbm und vec heraus. Ich sehe, dass die „normalen“ Bilder (größtenteils) als jpeg/ppm/pbm extrahiert werden, aber ich sehe nicht, dass die Grafiken dort sind – und daher vermute ich, dass pdf2xml sie als .vec-Dateien speichert.

Die Frage ist also, wie bekomme ich meine Grafiken? Ich habe convert verwendet das kommt mit imagemagick, um .vec in jpeg/png usw. umzuwandeln, aber ohne Erfolg.

Akzeptierte Antwort:

Ich habe pdf2xml noch nie ausprobiert, aber beim Durchsuchen seiner Dateien auf SourceForge fand ich vec2svg-2.py, das ein Python-Skript zu sein scheint, um .vec-Dateien in .svg zu konvertieren. Sie sollten keine Schwierigkeiten haben, SVG in das gewünschte Format zu konvertieren.

python vec2svg-2.py -i file.vec -o file.svg

Linux
  1. Linux – Daten aus /etc/shadow extrahieren?

  2. Kachel mit vielen Bildern vom Terminal?

  3. Probleme bei der Fotoübertragung von der Kamera?

  4. Wie extrahiere ich einen einzelnen Byteblock aus einer Datei?

  5. Wie extrahiere ich die Dauer aus der ffmpeg-Ausgabe?

So erstellen Sie eine Montage aus Bildern unter Linux

So extrahieren Sie E-Mail-Adressen aus einer Textdatei unter Linux

So erstellen Sie ein Video aus Bildern unter Linux

Extrahieren Sie eine einzelne Datei aus einer riesigen TGZ-Datei

Befehlszeile:Substring aus der Ausgabe extrahieren

Zeilen von unten extrahieren, bis Regex übereinstimmt