使用Requests和lxml,获取表中行的href值

去创造

的Python 3

我很难遍历表的行。

如何tr[1]通过表主体中的teamName,teamState,teamLink xpaths的行数迭代组件?

import lxml.html
from lxml.etree import XPath
url = "http://www.maxpreps.com/rankings/basketball-winter-15-16/7/national.htm"

rows_xpath = XPath('//*[@id="rankings"]/tbody)
teamName_xpath = XPath('//*[@id="rankings"]/tbody/tr[1]/th/a/text()')
teamState_xpath = XPath('//*[@id="rankings"]/tbody/tr[1]/td[2]/text()')
teamLink_xpath = XPath('//*[@id="rankings"]/tbody/tr[1]/th/a/@href')

html = lxml.html.parse(url)

for row in rows_xpath(html):
    teamName = teamName_xpath(row)
    teamState = teamState_xpath(row)
    teamLink = teamLink_xpath(row)
    print (teamName, teamLink)

我还尝试通过以下方法进行此操作:

from lxml import html
import requests

siteItem = ['http://www.maxpreps.com/rankings/basketball-winter-15-16/7/national.htm'
            ]

def linkScrape():
    page = requests.get(target)
    tree = html.fromstring(page.content)

#Get team link
    for link in tree.xpath('//*[@id="rankings"]/tbody/tr[1]/th/a/@href'):
        print (link)
#Get team name        
    for name in tree.xpath('//*[@id="rankings"]/tbody/tr[1]/th/a/text()'):
        print (name)
#Get team state        
    for state in tree.xpath('//*[@id="rankings"]/tbody/tr[1]/td[2]/text()'):
        print (state)

for target in siteItem:
    linkScrape()

谢谢你的:D

幼虫

如果我了解您的要求,则要遍历ranking表中的行因此,从这些行的循环开始:

import lxml.html
doc = lxml.html.parse('http://www.maxpreps.com/rankings/basketball-winter-15-16/7/national.htm')

for row in doc.xpath('//table[@id="rankings"]/tbody/tr'):

这将遍历该文档中的每一行。现在,对于每一行,提取所需的数据:

    team_link = row.xpath('th/a/@href')[0]
    team_name = row.xpath('th/a/text()')[0]
    team_state = row.xpath('td[contains(@class, "state")]/text()')[0]
    print(team_state, team_name, team_link)

在我的系统上哪个产生如下输出:

CA Manteca /high-schools/manteca-buffaloes-(manteca,ca)/basketball-winter-15-16/rankings.htm
MD Mount St. Joseph (Baltimore) /high-schools/mount-st-joseph-gaels-(baltimore,md)/basketball-winter-15-16/rankings.htm
TX Brandeis (San Antonio) /high-schools/brandeis-broncos-(san-antonio,tx)/basketball-winter-15-16/rankings.htm

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何获取二维数组中行和列的长度?

来自分类Dev

使用SQL从MS Access表中获取可变的年末日期和值

来自分类Dev

在网格视图中获取选中行的textBox值

来自分类Dev

获取Pandas DataFrame中行之间的差异值

来自分类Dev

Python:使用lxml + objectify + findall或fromstring获取特定的节点值和属性

来自分类Dev

如何使用R获取绘图中行和列的总和

来自分类Dev

单击时如何获取表中行的第一个值?

来自分类Dev

使用PHP从<a>标记中获取href值

来自分类Dev

使用XPath从表的最左列获取href

来自分类Dev

获取“ href”值

来自分类Dev

如何使用jquery从表中获取所有数据,包括输入和选择标签值?

来自分类Dev

获取列中行的子集的最大值

来自分类Dev

如何获取二维数组中行和列的长度?

来自分类Dev

在网格视图中获取选中行的textBox值

来自分类Dev

Python:使用lxml + objectify + findall或fromstring获取特定的节点值和属性

来自分类Dev

使用jQuery获取表内的Dropbox和TextBox值

来自分类Dev

如何获取表行中href的值?

来自分类Dev

使用SQL Server查询从出勤记录表和员工表中获取空值?

来自分类Dev

计算SAS表中行中的某些值

来自分类Dev

如何获取所有选中行的列值?

来自分类Dev

返回模板表中行和列的索引

来自分类Dev

从表的选中行中获取数据

来自分类Dev

获取 Pandas 数据透视表中行的 cumprod()

来自分类Dev

使用 javacsript 在网格视图中获取复选框选中行的相应行值

来自分类Dev

如何在html上使用lxml获取属性值

来自分类Dev

查找值是表中行和列的串联

来自分类Dev

使用 VBA 获取嵌套表和 Div 中的值

来自分类Dev

如何使用 lxml 抓取表格并获取 href 链接?

来自分类Dev

如何使用 Pandas 获取数据透视表中行标题的行号?

Related 相关文章

  1. 1

    如何获取二维数组中行和列的长度?

  2. 2

    使用SQL从MS Access表中获取可变的年末日期和值

  3. 3

    在网格视图中获取选中行的textBox值

  4. 4

    获取Pandas DataFrame中行之间的差异值

  5. 5

    Python:使用lxml + objectify + findall或fromstring获取特定的节点值和属性

  6. 6

    如何使用R获取绘图中行和列的总和

  7. 7

    单击时如何获取表中行的第一个值?

  8. 8

    使用PHP从<a>标记中获取href值

  9. 9

    使用XPath从表的最左列获取href

  10. 10

    获取“ href”值

  11. 11

    如何使用jquery从表中获取所有数据,包括输入和选择标签值?

  12. 12

    获取列中行的子集的最大值

  13. 13

    如何获取二维数组中行和列的长度?

  14. 14

    在网格视图中获取选中行的textBox值

  15. 15

    Python:使用lxml + objectify + findall或fromstring获取特定的节点值和属性

  16. 16

    使用jQuery获取表内的Dropbox和TextBox值

  17. 17

    如何获取表行中href的值?

  18. 18

    使用SQL Server查询从出勤记录表和员工表中获取空值?

  19. 19

    计算SAS表中行中的某些值

  20. 20

    如何获取所有选中行的列值?

  21. 21

    返回模板表中行和列的索引

  22. 22

    从表的选中行中获取数据

  23. 23

    获取 Pandas 数据透视表中行的 cumprod()

  24. 24

    使用 javacsript 在网格视图中获取复选框选中行的相应行值

  25. 25

    如何在html上使用lxml获取属性值

  26. 26

    查找值是表中行和列的串联

  27. 27

    使用 VBA 获取嵌套表和 Div 中的值

  28. 28

    如何使用 lxml 抓取表格并获取 href 链接?

  29. 29

    如何使用 Pandas 获取数据透视表中行标题的行号?

热门标签

归档