php:如何从给定页面的特定div获取所有超链接?

我不想

我正在尝试div从此网站上获取新闻的所有链接URL

要获得所有链接,在查看源代码之后,什么也没有。

但是有什么数据显示

可以在任何能够理解PHPArray()JS帮助我,好吗?

这是我获取内容的代码:

$html = file_get_contents("https://qc.yahoo.com/");
if ($result === FALSE) {
    die("?");
} 
echo $html;
迪帕克(Deepak Chaudhary)

假设您Anchor要从给定页面中提取所有带有其超链接的标签。

现在file_get_contents,对该URL进行操作存在某些问题

  1. 用于压缩的字符编码,即 gzip
  2. URL的SSL验证。

因此,为了克服gzip字符编码的第一个问题,我们将使用CURL作为他的答案中建议的@ gregn3。但是他错过了使用CURL自动解压缩gzip内容的功能。

对于第二个问题,您可以按照指南进行操作,也可以通过CURL的curl_setopt方法禁用SSL验证

现在,将从给定页面中提取所有链接的代码为:

<?php

$url = "https://qc.yahoo.com/";

# download resource
$c = curl_init ($url);
curl_setopt($c, CURLOPT_HTTPHEADER, ["Accept-Encoding:gzip"]);
curl_setopt ($c, CURLOPT_RETURNTRANSFER, true);
curl_setopt($c, CURLOPT_FOLLOWLOCATION, 1); 
curl_setopt($c, CURLOPT_ENCODING , "gzip");
curl_setopt($c, CURLOPT_VERBOSE, 1);
curl_setopt($c, CURLOPT_SSL_VERIFYPEER, 0);
curl_setopt($c, CURLOPT_SSL_VERIFYHOST, 0);
$content = curl_exec ($c);

curl_close ($c);

$links = preg_match_all ("/href=\"([^\"]+)\"/i", $content, $matches);

# output results
echo "url = " . htmlspecialchars ($url) . "<br>";
echo "links found (" . count ($matches[1]) . "):" . "<br>";
$n = 0;
foreach ($matches[1] as $link)
{
    $n++;
    echo "$n: " . htmlspecialchars ($link) . "<br>";
}

但是,如果您想进行高级html解析,则需要使用PHP Simple HTML Dom Parser在PHP Simple HTML Dom中,可以使用jQuery选择器选择div并获取anchor tags这是文档API手册

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何获取特定Facebook页面的所有墙贴?

来自分类Dev

如何找到链接到特定Wiki页面的所有Wiki页面?

来自分类Dev

使用ruby capybara获取页面的所有href链接

来自分类Dev

我该如何使用Powershell获取网站的网址并查看此页面的所有链接(抓取)

来自分类Dev

如何获取维基百科页面的所有链接及其Wikidata ID?

来自分类Dev

如何使用Python中的请求从Reddit页面的帖子中获取所有图像链接

来自分类Dev

在新标签页中打开给定页面上的所有超链接

来自分类Dev

如何获取Facebook中特定页面的所有帖子ID

来自分类Dev

如何在不登录的情况下在Facebook中获取给定公共页面的所有墙贴

来自分类Dev

如何使用PHP函数获取以HTML页面的{$开头的所有单词

来自分类Dev

PHP:如何链接给定文本内的所有链接?

来自分类Dev

获取给定维基百科页面的所有编辑者的列表

来自分类Dev

IIIF:获取书籍中给定一页的所有页面的 id 列表

来自分类Dev

如何获取wordpress页面的永久链接

来自分类Dev

如何使用PHP DOM获取超链接?

来自分类Dev

如何在页面上的所有超链接上调用函数?

来自分类Dev

如何在页面上的所有超链接上调用函数?

来自分类Dev

给定URL后如何从图像获取超链接

来自分类Dev

解析页面中超链接的所有html源

来自分类Dev

如何在iframe中显示div标签中的所有超链接

来自分类Dev

jQuery-获取所有超链接的图像

来自分类Dev

VBA获取Word文档中的所有超链接

来自分类Dev

正则表达式,获取所有超链接

来自分类Dev

如何等到所有页面加载后才能获取这些页面的元素?

来自分类Dev

如何获取维基百科页面的所有存档讨论页面?

来自分类Dev

如何等到所有页面加载后才能获取这些页面的元素?

来自分类Dev

jQuery:从HTML页面获取所有链接,除非链接属于特定的类或ID

来自分类Dev

如何停止带有超链接跳空的页面滚动?

来自分类Dev

从Wikipedia上的页面获取所有链接

Related 相关文章

  1. 1

    如何获取特定Facebook页面的所有墙贴?

  2. 2

    如何找到链接到特定Wiki页面的所有Wiki页面?

  3. 3

    使用ruby capybara获取页面的所有href链接

  4. 4

    我该如何使用Powershell获取网站的网址并查看此页面的所有链接(抓取)

  5. 5

    如何获取维基百科页面的所有链接及其Wikidata ID?

  6. 6

    如何使用Python中的请求从Reddit页面的帖子中获取所有图像链接

  7. 7

    在新标签页中打开给定页面上的所有超链接

  8. 8

    如何获取Facebook中特定页面的所有帖子ID

  9. 9

    如何在不登录的情况下在Facebook中获取给定公共页面的所有墙贴

  10. 10

    如何使用PHP函数获取以HTML页面的{$开头的所有单词

  11. 11

    PHP:如何链接给定文本内的所有链接?

  12. 12

    获取给定维基百科页面的所有编辑者的列表

  13. 13

    IIIF:获取书籍中给定一页的所有页面的 id 列表

  14. 14

    如何获取wordpress页面的永久链接

  15. 15

    如何使用PHP DOM获取超链接?

  16. 16

    如何在页面上的所有超链接上调用函数?

  17. 17

    如何在页面上的所有超链接上调用函数?

  18. 18

    给定URL后如何从图像获取超链接

  19. 19

    解析页面中超链接的所有html源

  20. 20

    如何在iframe中显示div标签中的所有超链接

  21. 21

    jQuery-获取所有超链接的图像

  22. 22

    VBA获取Word文档中的所有超链接

  23. 23

    正则表达式,获取所有超链接

  24. 24

    如何等到所有页面加载后才能获取这些页面的元素?

  25. 25

    如何获取维基百科页面的所有存档讨论页面?

  26. 26

    如何等到所有页面加载后才能获取这些页面的元素?

  27. 27

    jQuery:从HTML页面获取所有链接,除非链接属于特定的类或ID

  28. 28

    如何停止带有超链接跳空的页面滚动?

  29. 29

    从Wikipedia上的页面获取所有链接

热门标签

归档