无法保留从URL读取的文本中的换行符

卡什利卡什利

我正在使用Jsoup从URL阅读文本。以下链接提供了一些在将正文转换为文本时保留换行符的技巧,如何在使用jsoup将html转换为纯文本时保留换行符?

我使用以下几行代码来转换标签

  String prettyPrintedBodyFragment = Jsoup.clean(body, "", Whitelist
            .none().addTags("br", "p",  "h1"), new OutputSettings()
            .prettyPrint(true));
  System.out.println(prettyPrintedBodyFragment);

我仍然在单行中获得正文/内容。有什么线索吗?

编辑:这是完整的源代码,我只看到一行输出

 public static void main(String[] args) throws Exception {

        Connection conn = Jsoup.connect("http://finance.yahoo.com/");
        Document doc  = conn.get();

         String body = doc.body().text();

        String prettyPrintedBodyFragment = Jsoup.clean(body, "", Whitelist
                .none().addTags("br", "p",  "h1"), new OutputSettings()
                .prettyPrint(true));

        System.out.println(prettyPrintedBodyFragment);



    }
PopoFibo

更改:

String body = doc.body().text();

至:

String body = doc.body().html();

由于您已经在转储标签,Whitelist因此在格式化文本时无法将其包括在内。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

无法保留从URL读取的文本中的换行符

来自分类Dev

在保留换行符的同时从文本中删除空格

来自分类Dev

无法在文本文件中创建换行符

来自分类Dev

fgets无法读取换行符

来自分类Dev

将文本文件写入Blob时无法保留换行符

来自分类Dev

fgets 从提示中读取换行符

来自分类Dev

细长文本中的换行符

来自分类Dev

将textarea值复制到div中,并保留换行符和html作为文本

来自分类Dev

通过ssh在返回的文本中保留'\ n'换行符

来自分类Dev

Jinja呈现HTML保留换行符的文本

来自分类Dev

无法读取套接字响应中的换行符/回车符

来自分类Dev

无法在xargs中打印换行符

来自分类Dev

在Java中读取文本文件,要检查其使用哪种换行符

来自分类Dev

在Java中读取文本文件,要检查它使用哪种换行符

来自分类Dev

读取CSV的换行符,该换行符在spring batch的FlatfileItemReader中的文件中引用

来自分类Dev

asp:label不尊重从文本文件中读取的换行符。换行不符合预期

来自分类Dev

PHP简单html Dom无法读取(br /)换行符

来自分类Dev

如何保留空格但忽略CSS中的换行符?

来自分类Dev

.txt文件中的textarea内容,但保留换行符

来自分类Dev

.txt文件中的textarea内容,但保留换行符

来自分类Dev

在JSON中“保留”换行符的好方法?

来自分类Dev

无法从BeautifulSoup文本输出中删除换行符(Python 2.7.5)

来自分类Dev

正则表达式在 URL 中的换行符后查找文本

来自分类Dev

自定义URL方案以从移动浏览器在whatsapp中打开文本,换行符/换行符不起作用

来自分类Dev

使用换行符读取Java中的.properties文件

来自分类Dev

C语言,从外部文件中读取换行符

来自分类Dev

在 C# 中读取后消除换行符

来自分类Dev

无法在字符串中打印带有换行符的换行符

来自分类Dev

无法删除字符串中的所有换行符-仍然保留最后一个

Related 相关文章

  1. 1

    无法保留从URL读取的文本中的换行符

  2. 2

    在保留换行符的同时从文本中删除空格

  3. 3

    无法在文本文件中创建换行符

  4. 4

    fgets无法读取换行符

  5. 5

    将文本文件写入Blob时无法保留换行符

  6. 6

    fgets 从提示中读取换行符

  7. 7

    细长文本中的换行符

  8. 8

    将textarea值复制到div中,并保留换行符和html作为文本

  9. 9

    通过ssh在返回的文本中保留'\ n'换行符

  10. 10

    Jinja呈现HTML保留换行符的文本

  11. 11

    无法读取套接字响应中的换行符/回车符

  12. 12

    无法在xargs中打印换行符

  13. 13

    在Java中读取文本文件,要检查其使用哪种换行符

  14. 14

    在Java中读取文本文件,要检查它使用哪种换行符

  15. 15

    读取CSV的换行符,该换行符在spring batch的FlatfileItemReader中的文件中引用

  16. 16

    asp:label不尊重从文本文件中读取的换行符。换行不符合预期

  17. 17

    PHP简单html Dom无法读取(br /)换行符

  18. 18

    如何保留空格但忽略CSS中的换行符?

  19. 19

    .txt文件中的textarea内容,但保留换行符

  20. 20

    .txt文件中的textarea内容,但保留换行符

  21. 21

    在JSON中“保留”换行符的好方法?

  22. 22

    无法从BeautifulSoup文本输出中删除换行符(Python 2.7.5)

  23. 23

    正则表达式在 URL 中的换行符后查找文本

  24. 24

    自定义URL方案以从移动浏览器在whatsapp中打开文本,换行符/换行符不起作用

  25. 25

    使用换行符读取Java中的.properties文件

  26. 26

    C语言,从外部文件中读取换行符

  27. 27

    在 C# 中读取后消除换行符

  28. 28

    无法在字符串中打印带有换行符的换行符

  29. 29

    无法删除字符串中的所有换行符-仍然保留最后一个

热门标签

归档