Ich habe eine Situation, in der ich Bilder aus vielen PDF-Dateien extrahieren und auf einer Website anzeigen muss. Meine PDFs enthalten „normale“ Bilder sowie viele Grafiken.
Ich habe pdf2xml verwendet und es zieht die Bilder in den Formaten jpeg, ppm, pbm und vec heraus. Ich sehe, dass die „normalen“ Bilder (größtenteils) als jpeg/ppm/pbm extrahiert werden, aber ich sehe nicht, dass die Grafiken dort sind – und daher vermute ich, dass pdf2xml sie als .vec-Dateien speichert.
Die Frage ist also, wie bekomme ich meine Grafiken? Ich habe convert
verwendet das kommt mit imagemagick, um .vec in jpeg/png usw. umzuwandeln, aber ohne Erfolg.
Akzeptierte Antwort:
Ich habe pdf2xml noch nie ausprobiert, aber beim Durchsuchen seiner Dateien auf SourceForge fand ich vec2svg-2.py, das ein Python-Skript zu sein scheint, um .vec-Dateien in .svg zu konvertieren. Sie sollten keine Schwierigkeiten haben, SVG in das gewünschte Format zu konvertieren.
python vec2svg-2.py -i file.vec -o file.svg