从 Python 使用正确格式将 HTML 转换为 PDF

安德鲁

我一直在尝试使用 Wea​​syprint 和 PDFKIT 将网页转换为 pdf。我已成功保存了包含页面一部分的 PDF。在 weasyprint 中,我无法弄清楚如何从页面中获取正确的 CSS 样式。使用 PDFKIT 我似乎正在检索网站的移动版本而不是整个页面。我正在使用 python 3.6。

from urllib.request import Request, urlopen
import webbrowser
import pdfkit
import weasyprint

#pdfkit.from_url('http://google.com', 'out.pdf')

print("started script")
website = 'https://www.bbcgoodfood.com/recipes/3228/chilli-con-carne'
filename = 'savedPDF.pdf'

req = Request(website, headers={'User-Agent': 'Mozilla/5.0'})
print(urlopen(req).getcode())

temp = urlopen(req).getcode()
if temp == 200:
    pdfkit.from_url(website, 'out.pdf')

    weasyprint.HTML(website).write_pdf('/Users/me/Documents/weasyprint.pdf')
    weasyprint.HTML(website).write_pdf(filename,stylesheets=[weasyprint.CSS('https://www.bbcgoodfood.com/sites/default/files/advagg_css/css__pDgD1vQBFL4LZ6AO_Uw8wEc3MBEaHOzbhMtPie685P8__Kxa0k0VBbKvV5-TOMN_kW3S7CrkFMM4Zf0LjDvzMFnk__mXPuNFBZ0nocZLk5Qifty02tMfg-gomArSBCcGw1mLo.css')])

我看不到 pdfkit 中的选项来指定要连接的内容。此外,从 weasyprint 创建的两个 PDF 是相同的。

安德鲁

在对上述包进行了相当长的一段时间后,我仍在努力实现正确的输出。

我已经解决了使用 webkit2png,这几乎完美无缺,唯一的缺点是我在一些保存的文件中出现了 cookie 弹出消息。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python 将 json/html 转换为 pdf

来自分类Dev

使用Python将pdf数据转换为JSON格式吗?

来自分类Dev

使用httr将HTML转换为PDF

来自分类Dev

使用itextsharp将HTML转换为PDF

来自分类Dev

使用 Django 将 HTML 转换为 PDF

来自分类Dev

将PDF转换为图像(格式正确)

来自分类Dev

使用python将rtf转换为pdf

来自分类Dev

使用Python将PDF转换为图像

来自分类Dev

将HTML转换为Word然后转换为pdf

来自分类Dev

使用pdfkit在python中使用材质图标将html转换为pdf

来自分类Dev

使用pdf.js将html转换为pdf

来自分类Dev

使用pdf.js将html转换为pdf

来自分类Dev

从JavaScript将HTML页面转换为PDF

来自分类Dev

无法将 Html 内容转换为 Pdf

来自分类Dev

如何在Ubuntu中使用Python将HTML页面转换为Pdf?

来自分类Dev

从html转换为pdf的pdf页码-pdfkit,python / django

来自分类Dev

将PDF转换为DOC(Python / Bash)

来自分类Dev

使用Python将HTML转换为IMAGE

来自分类Dev

如何使用Cocoa将html文件转换为pdf

来自分类Dev

使用javascript将HTML表转换为pdf

来自分类Dev

如何使用Django将HTML页面转换为PDF

来自分类Dev

如何使用PHP将HTML + Javascript转换为PDF

来自分类Dev

如何使用JavaScript将HTML转换为Docx和PDF

来自分类Dev

如何使用书签将HTML转换为PDF

来自分类Dev

使用wkhtmltopdf将HTML转换为PDF失败

来自分类Dev

使用vb.net将itextsharp html转换为.pdf

来自分类Dev

使用Java中的API将PDF转换为HTML

来自分类Dev

使用pdfbox库将pdf转换为html页面

来自分类Dev

如何使用书签将HTML转换为PDF