Python中的findsoup findall

帕特里克P76

我试图在td类'column-1'中获取文本,但由于没有属性文本而遇到了麻烦-但是显然这样做,所以我必须做错了什么。这是代码:

import urllib
import urllib.request
from bs4 import BeautifulSoup

theurl="http://vermontamerican.com/products/standard-drill-bit-extensions/"
thepage = urllib.request.urlopen(theurl)
soup = BeautifulSoup(thepage,"html.parser")

for part in soup.find_all('td'),{"class":"column-1"}:
    part1 = part.text
    print(part1)

如果我取出第2行,然后在上面打印“ part”,我会得到一个结果,但它给出的是所有td而不只是column-1。我也尝试过这种方法,但是我是新手,所以我确信这在很多方面都是错误的。

import urllib
import urllib.request
from bs4 import BeautifulSoup

theurl="http://vermontamerican.com/products/standard-drill-bit-extensions/"
thepage = urllib.request.urlopen(theurl)
soup = BeautifulSoup(thepage,"html.parser")


for part in soup.find('tbody'),{"class":"row-hover"}:
    for part1 in part.find_all('a'):
        print(part1)
ec

您没有将属性选择字典传递给find_all()函数。代替:

for part in soup.find_all('td'),{"class":"column-1"}:

和:

for part in soup.find_all('td', {"class":"column-1"}):

现在,您的代码将产生:

17103
17104

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章