我收到了许多带有图像的pdf文件。原始图像已丢失,因此我需要提取它们。我有Adobe Acrobat Pro,所以我使用Advanced > Document Processing > Export All Images
(有四个选项:jpeg,png,tiff和jpeg2000)提取了它们。但是,我想以原始格式提取它们,而这显然不是jpeg:我还按照此处概述的方法从xpdf测试了pdfimages.exe,并且生成了.ppm文件,而不是jpeg。
因此,我尝试了ImageMagick的识别功能,这是给我的:
identify images-000.ppm
images-000.ppm PPM 870x1181 870x1181+0+0 8-bit sRGB 3.082MB 0.000u 0:00.000
这是否表明它是嵌入式.bmp?怎么说呢?我实际上希望Acrobat中的一个函数可以识别图像的格式,但是我找不到它。
那么,识别pdf中图像的图像格式的最佳方法是什么?
(由于具有批处理功能,我更喜欢通过Acrobat进行提取)。
AFAIK,嵌入在PDF中的Image XObjects不存储有关原始图像格式的任何信息。如果最多是嵌入式JPEG,则可以按原样提取,但是对于所有其他情况,最终会得到需要转换的PxM图像。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句