JSoup解析标签中的数据

三角香蕉

我正在解析我需要的大多数数据,除了其中一个数据,因为它包含在href标记中,并且我需要显示在“ mmsi =”后的数字

<a href="/showship.php?mmsi=235083844">Sunsail 4013</a>

我当前的解析器获取我需要的所有其他数据,并且在下面。我尝试了一些操作,注释掉的代码偶尔会返回未指定的条目。有什么办法可以添加到下面的代码中,以便在返回数据时,在名称“ Sunsail 4013”之前返回数字“ 235083844”?

try {
        File input = new File("shipMove.txt");
        Document doc = Jsoup.parse(input, null);
        Elements tables = doc.select("table.shipInfo");
        for( Element element : tables )
        {
            Elements tdTags = element.select("td");
            //Elements mmsi = element.select("a[href*=/showship.php?mmsi=]");
            // Iterate over all 'td' tags found
            for( Element td : tdTags ){
                // Print it's text if not empty
                final String text = td.text();
                if( text.isEmpty() == false )
                {
                    System.out.println(td.text());
                }
            }
        }
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

此处已解析数据和html文件的示例

PopoFibo
  1. 您可以attrElement对象上使用来检索特定属性的值
  2. 使用substring以获得所需的值,如果字符串模式是一致的

代码

// Using just your anchor html tag
String html = "<a href=\"/showship.php?mmsi=235083844\">Sunsail 4013</a>";
Document doc = Jsoup.parse(html);

// Just selecting the anchor tag, for your implementation use a generic one
Element link = doc.select("a").first();

// Get the attribute value
String url = link.attr("href");

// Check for nulls here and take the substring from '=' onwards
String id = url.substring(url.indexOf('=') + 1);
System.out.println(id + " "+ link.text());

给,

235083844 Sunsail 4013

for从代码中修改循环条件

...
    for (Element td : tdTags) {
                // Print it's text if not empty
                final String text = td.text();
                if (text.isEmpty() == false) {
                    if (td.getElementsByTag("a").first() != null) {
                        // Get the attribute value
                        String url = td.getElementsByTag("a").first().attr("href");

                        // Check for nulls here and take the substring from '=' onwards
                        String id = url.substring(url.indexOf('=') + 1);
                        System.out.println(id + " "+ td.text());
                    }
                    else {
                        System.out.println(td.text());
                    }
                }
            }
...

上面的代码将打印所需的输出。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Jsoup - 从表中的Java数据解析

来自分类Dev

如何在Jsoup解析中避免围绕HTML Head标签

来自分类Dev

使用 Jsoup 解析 dl 标签

来自分类Dev

在 TypeScript 中解析 JSON - 添加“数据”标签

来自分类Dev

如何解析Fragment中的Jsoup数据(WebView)

来自分类Dev

Jsoup解析数据永久链接

来自分类Dev

用jsoup库解析html meta标签

来自分类Dev

如何使用jsoup解析lu,li标签?

来自分类Dev

Java jsoup解析特定标签

来自分类Dev

使用Jsoup无需替换即可自动解析CDATA中的标签的自动方法

来自分类Dev

如何使用Jsoup将android中的li和ul标签解析为列表视图

来自分类Dev

使用Jsoup HTML解析器解析注释标签

来自分类Dev

JSOUP-提取Div标签的数据

来自分类Dev

Angular2:解析html标签中的数据

来自分类Dev

尝试解析JSON数据,但标签未在Swift中更新

来自分类Dev

在Jsoup中,如何通过属性而不是数据来解析CSS查询?

来自分类Dev

解析XML中的标签

来自分类Dev

如何在Android中使用Jsoup解析ul li标签

来自分类Dev

如何使用 Jsoup 解析嵌套描述列表(dl 标签)?

来自分类Dev

使用Jsoup解析blockquotes中的文本

来自分类Dev

使用JSoup解析复杂表中的值

来自分类Dev

如何提高Jsoup中的解析速度

来自分类Dev

XmlPullParser或JSoup用于在Android中解析HTML

来自分类Dev

JSoup同时提取href和div标签数据的绝对URL

来自分类Dev

解析HTML中的相关标签

来自分类Dev

jQuery:解析CDATA中的标签

来自分类Dev

如何在没有 div 的情况下使用 jsoup 解析 android studio 中的 ul 、 li 标签并将其显示在回收站视图中?

来自分类Dev

如何过滤JSoup中嵌套标签中的噪声?爪哇

来自分类Dev

使用 Python 中的 BeautifulSoup 解析具有不同数据的重复标签的 XML 文件

Related 相关文章

  1. 1

    Jsoup - 从表中的Java数据解析

  2. 2

    如何在Jsoup解析中避免围绕HTML Head标签

  3. 3

    使用 Jsoup 解析 dl 标签

  4. 4

    在 TypeScript 中解析 JSON - 添加“数据”标签

  5. 5

    如何解析Fragment中的Jsoup数据(WebView)

  6. 6

    Jsoup解析数据永久链接

  7. 7

    用jsoup库解析html meta标签

  8. 8

    如何使用jsoup解析lu,li标签?

  9. 9

    Java jsoup解析特定标签

  10. 10

    使用Jsoup无需替换即可自动解析CDATA中的标签的自动方法

  11. 11

    如何使用Jsoup将android中的li和ul标签解析为列表视图

  12. 12

    使用Jsoup HTML解析器解析注释标签

  13. 13

    JSOUP-提取Div标签的数据

  14. 14

    Angular2:解析html标签中的数据

  15. 15

    尝试解析JSON数据,但标签未在Swift中更新

  16. 16

    在Jsoup中,如何通过属性而不是数据来解析CSS查询?

  17. 17

    解析XML中的标签

  18. 18

    如何在Android中使用Jsoup解析ul li标签

  19. 19

    如何使用 Jsoup 解析嵌套描述列表(dl 标签)?

  20. 20

    使用Jsoup解析blockquotes中的文本

  21. 21

    使用JSoup解析复杂表中的值

  22. 22

    如何提高Jsoup中的解析速度

  23. 23

    XmlPullParser或JSoup用于在Android中解析HTML

  24. 24

    JSoup同时提取href和div标签数据的绝对URL

  25. 25

    解析HTML中的相关标签

  26. 26

    jQuery:解析CDATA中的标签

  27. 27

    如何在没有 div 的情况下使用 jsoup 解析 android studio 中的 ul 、 li 标签并将其显示在回收站视图中?

  28. 28

    如何过滤JSoup中嵌套标签中的噪声?爪哇

  29. 29

    使用 Python 中的 BeautifulSoup 解析具有不同数据的重复标签的 XML 文件

热门标签

归档