搜索

搜索

正则表达式从URL中包含特定单词的任何网页打印URL

debugcn 发表于 Dev

14

切特纳123

我正在使用下面的代码从网页中提取URL，它的工作正常，但我想对其进行过滤。它会显示该页面中的所有网址，但我只希望包含“ super”一词的网址

     $regex='|<a.*?href="(.*?)"|';
preg_match_all($regex,$result,$parts);
$links=$parts[1];
foreach($links as $link){
echo $link."<br>";

       }

因此，它应该仅在出现单词super的地方回应uls。例如，它应该忽略网址

       http://xyz.com/abc.html

但它应该回声

        http://abc.superpower.com/hddll.html

因为它由url中必需的单词super组成

阿努巴瓦

使您的正则表达式不贪心，它应该可以工作：

$regex = '|<a.*?href="(.*?super[^"]*)"|is';

但是，要解析和废弃HTML，最好使用php的DOM解析器。

更新：这是使用DOM解析器的代码：

$request_url ='1900girls.blogspot.in/';
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $request_url);    
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
$result = curl_exec($ch);

$doc = new DOMDocument();
libxml_use_internal_errors(true);
$doc->loadHTML($result); // loads your html
$xpath = new DOMXPath($doc);
$needle = 'blog';

$nodelist = $xpath->query("//a[contains(@href, '" . $needle . "')]");
for($i=0; $i < $nodelist->length; $i++) {
    $node = $nodelist->item($i);
    echo $node->getAttribute('href') . "\n";
}

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-4

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

正则表达式从 URL 中删除特定单词

来自分类Dev

包含特定单词的正则表达式

来自分类Dev

正则表达式模式使用htaccess在url开头排除特定单词

来自分类Dev

使用正则表达式查找没有特定单词模式的 URL

来自分类Dev

排除特定单词的精确 url 匹配的正则表达式

来自分类Dev

用于查找没有特定单词的 mp3 URL 的正则表达式

来自分类Dev

正则表达式查找包含给定序列并排除特定单词的单词

来自分类Dev

正则表达式以匹配包含类中特定单词并具有特定ID的标签

来自分类Dev

选择包含带有正则表达式的特定单词的特定html标签

来自分类Dev

如何用正则表达式接受除特定单词以外的任何内容

来自分类Dev

正则表达式排除特定单词

来自分类Dev

特定单词的Python正则表达式

来自分类Dev

正则表达式匹配特定单词

来自分类Dev

用于识别仅包含特定单词的字符串的正则表达式

来自分类Dev

对不包含特定单词的句子使用正则表达式匹配

来自分类Dev

如何用正则表达式选择包含特定单词的多行？

来自分类Dev

PHP正则表达式提取匹配标记包含特定单词的地方

来自分类Dev

正则表达式-包含特定单词的图像名称

来自分类Dev

捕获包含2个特定单词的字符串的正则表达式

来自分类Dev

正则表达式：选择/查找包含特定单词的所有标签

来自分类Dev

正则表达式，用于匹配不带扩展名且带有特定单词的URL

来自分类Dev

正则表达式返回以特定单词开头的行中的所有单词

来自分类Dev

使用正则表达式仅匹配特定单词中的一个单词

来自分类Dev

PHP正则表达式检查是否包含特定单词，但不包含其他单词

来自分类Dev

如何使用正则表达式中的特定单词获取ID？

来自分类Dev

VB.net中特定单词的正则表达式

来自分类Dev

使用R中的正则表达式查找最接近特定单词的数字

来自分类Dev

正则表达式用于在电子邮件VBA中获取特定单词

来自分类Dev

使用正则表达式从python中的文本中提取特定单词

Related 相关文章

文章

热门标签

归档