通过iText和XMLWorker用波兰语字母将HTML转换为PDF

库尔德

我有一个带有示例的字符串-它确实很棒,但是当我添加波兰字母时,它们就消失了。我尝试过这样的事情:

        byte[] byteArray = str.getBytes(Charset.forName("UTF-8"));
        ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(byteArray);
        worker.parseXHtml(pdfWriter, document, byteArrayInputStream, Charset.forName("UTF-8"));

但这并没有改变任何东西。如何添加波兰字母?

编辑:它仍然不起作用。

代码:

        document.open();

        XMLWorkerHelper worker = XMLWorkerHelper.getInstance();
        String str = "<html><head></head><body style=\"font-size:12.0pt; font-family:Times New Roman\">"+
                "<a href='http://www.rgagnon.com/howto.html'><b>Real's HowTo</b></a>" +
                "<h1>Show your support</h1>" +
                "<p>It DOES cost a lot to produce this site - in ISP storage and transfer fees</p>" +
                "<p>TEST POLSKICH ZNAKÓW: ĄąćCÓ󣳯żŹźĘę</p>" +
                "<hr/>" +
                "<p>the huge amounts of time it takes for one person to design and write the actual content.</p>" +
                "<p>If you feel that effort has been useful to you, perhaps you will consider giving something back?</p>" +
                "<p>Donate using PayPalŽ</p>" +
                "<p>Contributions via PayPal are accepted in any amount</p>" +
                "<p><br/><table border='1'><tr><td>Java HowTo</td></tr><tr>" +
                "<td style='background-color:red;'>Javascript HowTo</td></tr>" +
                "<tr><td>Powerbuilder HowTo</td></tr></table></p>" +
                "</body></html>";

        byte[] byteArray = str.getBytes(Charset.forName("UTF-8"));
        ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(byteArray);
        worker.parseXHtml(pdfWriter, document, byteArrayInputStream, Charset.forName("UTF-8"));

        document.close();

也许有人会发现一个错误。

布鲁诺·洛瓦吉

我已经获取了示例HTML,并用它来创建ParseHtml2示例。生成的PDF html_2.pdf如下所示:

在此处输入图片说明

乍一看,我看不出波兰语字符有任何问题。

我使用的代码如下所示:

public void createPdf(String file) throws IOException, DocumentException {
    // step 1
    Document document = new Document();
    // step 2
    PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream(file));
    // step 3
    document.open();
    // step 4
    String str = "<html><head></head><body style=\"font-size:12.0pt; font-family:Times New Roman\">"+
            "<a href='http://www.rgagnon.com/howto.html'><b>Real's HowTo</b></a>" +
            "<h1>Show your support</h1>" +
            "<p>It DOES cost a lot to produce this site - in ISP storage and transfer fees</p>" +
            "<p>TEST POLSKICH ZNAKÓW: \u0104\u0105\u0106\u0107\u00d3\u00f3\u0141\u0142\u0179\u017a\u017b\u017c\u017d\u017e\u0118\u0119</p>" +
            "<hr/>" +
            "<p>the huge amounts of time it takes for one person to design and write the actual content.</p>" +
            "<p>If you feel that effort has been useful to you, perhaps you will consider giving something back?</p>" +
            "<p>Donate using PayPal\u017d</p>" +
            "<p>Contributions via PayPal are accepted in any amount</p>" +
            "<p><br/><table border='1'><tr><td>Java HowTo</td></tr><tr>" +
            "<td style='background-color:red;'>Javascript HowTo</td></tr>" +
            "<tr><td>Powerbuilder HowTo</td></tr></table></p>" +
            "</body></html>";

    XMLWorkerHelper worker = XMLWorkerHelper.getInstance();
    InputStream is = new ByteArrayInputStream(str.getBytes(StandardCharsets.UTF_8));
    worker.parseXHtml(writer, document, is, Charset.forName("UTF-8"));
    // step 5
    document.close();
}

请注意,您已定义Times New Roman为字体。您的操作系统必须能够访问具有该名称的字体,这一点很重要,否则您仍然会以Helvetica结尾。

另请注意,在源代码中使用非ASCII字符被视为危害良好品味的犯罪。源代码存储为文本文件,但是使用哪种编码?无法保证您的文件将存储为UTF-8,不能保证编译器会将其读取为UTF-8,也不能保证版本控制系统将接受UTF-8,...因此,我将其替换为所有UTF-8字符的unicode值,这使我可以将源文件保留为ASCII。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用 XSLT 将 XML 转换为 CSV - 保留波兰语字母

来自分类Dev

转换为PDF时的iText XMLWorker表怪异

来自分类Dev

从Itext 5.5和XMLWorker的HTML到PDF的阿拉伯文本转换

来自分类Dev

如何从递归函数返回指针,递归函数将波兰语符号转换为反向波兰语符号?

来自分类Dev

从波兰语转换为日语再回到波兰语后,如何将字符恢复到原始状态?

来自分类Dev

使用itextsharp xmlworker将html转换为pdf并垂直写入文本

来自分类Dev

使用多种字体将 itext html 转换为 pdf

来自分类Dev

使用多种字体将 itext html 转换为 pdf

来自分类Dev

如何使用iText和XMLWorker生成有效的PDF / A文件(HTML到PDF / A进程)

来自分类Dev

将月度希伯来语转换为Excel中的字母

来自分类Dev

MySQL对波兰语字母的支持-ę

来自分类Dev

通过Jquery将HTML Div转换为PDF

来自分类Dev

Java用css + js将html转换为pdf

来自分类Dev

使用iText库将pdf转换为pdf / a

来自分类Dev

在itext 7中将html转换为pdf时如何继续特定div标签的横向?

来自分类Dev

如何使用JavaScript将HTML转换为Docx和PDF

来自分类Dev

在 asp.net c# 中将 Html Div(带标签和印地语 Unicode)转换为 PDF

来自分类Dev

使用iText将TXT文件转换为PDF(保留格式)

来自分类Dev

ClassCastException使用iText将TIF转换为PDF

来自分类Dev

ClassCastException使用iText将TIF转换为PDF

来自分类Dev

使用Itext将Pdf页转换为Byte数组

来自分类Dev

将HTML转换为-> PDF->转换为MULTIPARTFILE SpringBoot和Thymeleaf

来自分类Dev

正则表达式:如何让 java 将波兰语字母视为正常 \w?

来自分类Dev

PDF波兰语中的字符错误

来自分类Dev

Swift String 省略/转换波兰语重音

来自分类Dev

在Android上使用iText将HTML转换为PDF。如何设置UTF-8(变音符号)?

来自分类Dev

iText7-将HTML转换为PDF时不呈现CSS3文本溢出属性

来自分类Dev

Fabric js 将 HTML 代码转换为 IText

来自分类Dev

使用httr将HTML转换为PDF

Related 相关文章

  1. 1

    使用 XSLT 将 XML 转换为 CSV - 保留波兰语字母

  2. 2

    转换为PDF时的iText XMLWorker表怪异

  3. 3

    从Itext 5.5和XMLWorker的HTML到PDF的阿拉伯文本转换

  4. 4

    如何从递归函数返回指针,递归函数将波兰语符号转换为反向波兰语符号?

  5. 5

    从波兰语转换为日语再回到波兰语后,如何将字符恢复到原始状态?

  6. 6

    使用itextsharp xmlworker将html转换为pdf并垂直写入文本

  7. 7

    使用多种字体将 itext html 转换为 pdf

  8. 8

    使用多种字体将 itext html 转换为 pdf

  9. 9

    如何使用iText和XMLWorker生成有效的PDF / A文件(HTML到PDF / A进程)

  10. 10

    将月度希伯来语转换为Excel中的字母

  11. 11

    MySQL对波兰语字母的支持-ę

  12. 12

    通过Jquery将HTML Div转换为PDF

  13. 13

    Java用css + js将html转换为pdf

  14. 14

    使用iText库将pdf转换为pdf / a

  15. 15

    在itext 7中将html转换为pdf时如何继续特定div标签的横向?

  16. 16

    如何使用JavaScript将HTML转换为Docx和PDF

  17. 17

    在 asp.net c# 中将 Html Div(带标签和印地语 Unicode)转换为 PDF

  18. 18

    使用iText将TXT文件转换为PDF(保留格式)

  19. 19

    ClassCastException使用iText将TIF转换为PDF

  20. 20

    ClassCastException使用iText将TIF转换为PDF

  21. 21

    使用Itext将Pdf页转换为Byte数组

  22. 22

    将HTML转换为-> PDF->转换为MULTIPARTFILE SpringBoot和Thymeleaf

  23. 23

    正则表达式:如何让 java 将波兰语字母视为正常 \w?

  24. 24

    PDF波兰语中的字符错误

  25. 25

    Swift String 省略/转换波兰语重音

  26. 26

    在Android上使用iText将HTML转换为PDF。如何设置UTF-8(变音符号)?

  27. 27

    iText7-将HTML转换为PDF时不呈现CSS3文本溢出属性

  28. 28

    Fabric js 将 HTML 代码转换为 IText

  29. 29

    使用httr将HTML转换为PDF

热门标签

归档