是否有(Linux)命令行工具可以从MS Word文档中提取所有图像(最好是可以处理.docx格式的图像)?
由于docx文件是zip文件,因此您可以解压缩docx文件,然后选择图像文件。
我没有要测试的Microsoft Office,所以我从互联网上下载了一些随机的docx文件。图像似乎总是存储在word/media
归档文件的目录中。
此命令将从media
档案库的目录中提取所有文件:
unzip foo.docx "word/media/*"
此命令将仅提取*.jpeg
文件:
unzip foo.docx "*.jpeg"
请注意,您必须指定"*.jpg"
如果文件被保存为jpg
代替jpeg
。我认为图像也可能以其他格式存储。我不知道图像是否可以存储在word/media
目录以外的其他位置。您可以使用unzip -l
列出存档的内容。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句