如何使用adblockparser规则匹配html tag.id或tag.class名称?

法赫尔
from bs4 import BeautifulSoup
soup = BeautifulSoup(html_doc,'html.parser')
for tag in soup.find_all(True):
    print rules.should_block([TAG ID OR TAG CLASS])    

据我所知,Adblock可以基于其名称来阻止HTML元素。

例如:

如果divID为#ads,则会被阻止。

我该如何做类似的事情?

曼谷人

要阻止一个类名,您将需要过滤器

||domain.com##.classnamehere

要按ID屏蔽元素,您将需要过滤器

||domain.com###IDnamehere

如果您想更好地了解过滤器,可以在这里找到一个很好的入门手册:https : //adblockplus.org/filters

如果您想了解哪些过滤器正在影响特定网站,请在此处找到一个不错的过滤器搜索引擎:http : //blockadblock.com/search-adblock-filters.php

将过滤器添加到Python解析器可能不在此答案的范围内,但此处有很多很好的文档:https : //github.com/scrapinghub/adblockparser

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在不知道 JavaScript 中的 id/class/tag 的情况下分配给 HTML 元素?

来自分类Dev

选择元素时,为什么使用id,class和tag(例如“ .my-class”,“ button”)要比“ [name ='my-name']”

来自分类Dev

XSLT 获取空 TAG 名称

来自分类Dev

如何通过jquery获得tag-it中每个标签的名称?

来自分类Dev

Include html based on li tag's id in JQuery

来自分类Dev

如何将id添加到form_tag?

来自分类Dev

HTML Tail Tag to complement Head Tag

来自分类Dev

如何删除以<tag>开头,以</ tag>结尾

来自分类Dev

tag.class和tag .class有什么区别?

来自分类Dev

Parent Class in Google Tag Manager

来自分类Dev

Use of <p> tag in html

来自分类Dev

如何使用Django Cycle Tag

来自分类Dev

HTML-Input tag syntax

来自分类Dev

Preg_replace Tag Replace Dashes With HTML Tag

来自分类Dev

git tag --contains如何工作?

来自分类Dev

如何记录JSP“ .tag”文件?

来自分类Dev

将HTML ID添加到form_tag rails 4

来自分类Dev

使用JGit从Tag加载内容

来自分类Dev

Rails:如何在text_field_tag中设置ID或Name属性?

来自分类Dev

如何从Android上面的api 8获取流式mp3 url的id3tag

来自分类Dev

如何在Magnolia CMS Marketing Tag中登录用户ID

来自分类Dev

使用JavaScript通过tag-> id-> element获取嵌套元素

来自分类Dev

如何遍历汤.findAll('tag1','tag2','tag3')中的多个标签?

来自分类Dev

displaying different text with same id tag jquery

来自分类Dev

{id}与{tag}之间的Laravel路线差异

来自分类Dev

自动操作分配特殊的tag_id

来自分类Dev

如何使用data-attribute设置Select HTML tag的选项

来自分类Dev

访问 html 类,如 js 中的 css `tag[class*="samepart-"]`

来自分类Dev

如何在Rails 3.2中使用一对check_box_tag保存一对ID?

Related 相关文章

热门标签

归档