如何使用HttpClient从网页获取“标题”

马里奥S

我正在尝试使用Apache HttpClient 4从网页获取“标题”。

编辑:我的第一种方法是尝试从标头中获取它(使用HttpHead)。如果不可能的话,如何像@Todd所说的那样从响应的主体中获取它?

编辑2:

<head>
[...]
<title>This is what I need to get!</title>
[...]
</head>
马里奥S

谢谢大家的评论。一旦使用了jsoup,该解决方案就非常简单。

Document doc = Jsoup.connect("http://example.com/").get();
String title = doc.title();

考虑到我真的需要使用HttpClient进行连接,这就是我所拥有的:

org.jsoup.nodes.Document doc = null;
String title = "";

System.out.println("Getting content... ");

CloseableHttpClient httpclient = HttpClients.createDefault();
HttpHost target = new HttpHost(host);
HttpGet httpget = new HttpGet(path);
CloseableHttpResponse response = httpclient.execute(target, httpget);

System.out.println("Parsing content... ");

try {
    String line = null;
    StringBuffer tmp = new StringBuffer();
    BufferedReader in = new BufferedReader(new InputStreamReader(response.getEntity().getContent()));
    while ((line = in.readLine()) != null) {                    
        String decoded = new String(line.getBytes(), "UTF-8");
        tmp.append(" ").append(decoded);
    }

    doc = Jsoup.parse(String.valueOf(tmp)); 

    title = doc.title();
    System.out.println("Title=" + title); //<== ^_^

    //[...]

} finally {
    response.close();
}

System.out.println("Done.");

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用 JavaScript 执行器获取网页标题

来自分类Dev

如何使用Ajax从网页上使用httpclient 4.3.x获取信息

来自分类Dev

从任何网页获取标题

来自分类Dev

使用BeautifulSoup搜寻网页以获取链接标题和URL

来自分类Dev

如何使用php curl获取网页并显示该网页html?

来自分类Dev

如何使用静态标题创建响应式网页?

来自分类Dev

如何使用javascript获取网页的长度/大小

来自分类Dev

如何使用C ++从网页获取文本?

来自分类Dev

如何使用XMLHTTP从网页获取信息

来自分类Dev

如何使用 PHP 获取网页的内容

来自分类Dev

如何使用PHP获取链接标签的标题

来自分类Dev

如何使用autohotkey获取活动窗口的标题

来自分类Dev

如何使用XPath获取YouTube标题

来自分类Dev

如何使用bash使用“ grep”获取网页的特定部分

来自分类Dev

如何使用Javascript获取网页上图像的文件大小?

来自分类Dev

如何使用Python从网页的检查元素获取数据

来自分类Dev

如何使用JSoup从网页获取资源类型?

来自分类Dev

如何使用Java获取安全网页的公钥

来自分类Dev

如何使用JavaScript从网页中获取突出显示的文本

来自分类Dev

您如何使用Python xpath从网页获取信息?

来自分类Dev

如何使用打开的下拉菜单获取网页?

来自分类Dev

如何使用检查VBA编码获取网页的HTML元素

来自分类Dev

如何使用WWW :: Mechanize和Perl从网页获取链接

来自分类Dev

PHP:如何使用cURL获取网页的基本URL

来自分类Dev

如何使用加载的源从网页获取文本框内容

来自分类Dev

如何使用Java获取外部网页的XMLHTTPRequest响应文本?

来自分类Dev

如何使用 node.js 获取网页内容

来自分类Dev

如何使用Robot Framework获取网页元素的所有xpath?

来自分类Dev

如何使用 $.ajax() jquery 获取数据并显示到 HTML 网页

Related 相关文章

  1. 1

    如何使用 JavaScript 执行器获取网页标题

  2. 2

    如何使用Ajax从网页上使用httpclient 4.3.x获取信息

  3. 3

    从任何网页获取标题

  4. 4

    使用BeautifulSoup搜寻网页以获取链接标题和URL

  5. 5

    如何使用php curl获取网页并显示该网页html?

  6. 6

    如何使用静态标题创建响应式网页?

  7. 7

    如何使用javascript获取网页的长度/大小

  8. 8

    如何使用C ++从网页获取文本?

  9. 9

    如何使用XMLHTTP从网页获取信息

  10. 10

    如何使用 PHP 获取网页的内容

  11. 11

    如何使用PHP获取链接标签的标题

  12. 12

    如何使用autohotkey获取活动窗口的标题

  13. 13

    如何使用XPath获取YouTube标题

  14. 14

    如何使用bash使用“ grep”获取网页的特定部分

  15. 15

    如何使用Javascript获取网页上图像的文件大小?

  16. 16

    如何使用Python从网页的检查元素获取数据

  17. 17

    如何使用JSoup从网页获取资源类型?

  18. 18

    如何使用Java获取安全网页的公钥

  19. 19

    如何使用JavaScript从网页中获取突出显示的文本

  20. 20

    您如何使用Python xpath从网页获取信息?

  21. 21

    如何使用打开的下拉菜单获取网页?

  22. 22

    如何使用检查VBA编码获取网页的HTML元素

  23. 23

    如何使用WWW :: Mechanize和Perl从网页获取链接

  24. 24

    PHP:如何使用cURL获取网页的基本URL

  25. 25

    如何使用加载的源从网页获取文本框内容

  26. 26

    如何使用Java获取外部网页的XMLHTTPRequest响应文本?

  27. 27

    如何使用 node.js 获取网页内容

  28. 28

    如何使用Robot Framework获取网页元素的所有xpath?

  29. 29

    如何使用 $.ajax() jquery 获取数据并显示到 HTML 网页

热门标签

归档