python lxml xpath没有输出

Humblenoob

出于教育目的,我试图使用lxml和Python中的请求来抓取此页面

具体来说,我只想在页面上打印所有教授的研究领域。这是我到目前为止所做的

import requests
from lxml import html

response=requests.get('http://cse.iitkgp.ac.in/index.php?secret=d2RkOUgybWlNZzJwQXdLc28wNzh6UT09')
parsed_body=html.fromstring(response.content)

for row in parsed_body.xpath('//div[@id="maincontent"]//tr[position() mod 2 = 1]'):
    for column in row.xpath('//td[@class="fcardcls"]/tr[2]/td/font/text()'):        
        print column.strip()    

但是它没有打印任何东西。我在xpaths上挣扎了很多,最初使用了chrome中的copy xpath功能。我遵循了以下SO问题/答案中的操作,并相当多地清理了我的代码,并在xpaths中摆脱了“ tbody”。代码仍然返回空白。

1.返回空清单

2. Python-lxml-xpath问题

ec

首先,通过XHR请求从不同的端点加载内部包含所需数据的主要内容-在您的代码中进行模拟。

这是完整的工作代码打印名称以及每个名称的研究领域列表

import requests
from lxml import html

response = requests.get('http://cse.iitkgp.ac.in/faculty4.php?_=1450503917634')
parsed_body = html.fromstring(response.content)

for row in parsed_body.xpath('.//td[@class="fcardcls"]'):
    name = row.findtext(".//a[@href]/b")
    name = ' '.join(name.split())  # getting rid of multiple spaces

    research_areas = row.xpath('.//*[. = "Research Areas: "]/following-sibling::text()')[0].split(", ")

    print(name, research_areas)

这里的想法是利用以下事实:所有“教授块”都位于td带有的元素中class="fcardcls"对于每个块,请从粗体链接文本中获取名称,并从Research Areas:粗体文本后的以下字符串中获取研究区域的名称

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python,如何使用lxml XPath?

来自分类Dev

Python 2.7中的lxml输出

来自分类Dev

带有lxml的xpath用于Python获取数据

来自分类Dev

合并xpath生成的列表,Python,lxml

来自分类Dev

Python LXML xpath无法正常工作

来自分类Dev

python lxml xpath无法解析撇号

来自分类Dev

通过LXML通过XPATH查找元素-Python

来自分类Dev

xpath 到 dic python、lxml 和 xml

来自分类Dev

在 Python 中使用 XPath 和 ETXPath 的 LXML

来自分类Dev

Python lxml XPath SyntaxError:谓词无效

来自分类Dev

python lxml遍历所有标签

来自分类Dev

Python:lxml xpath获得两个不同的类

来自分类Dev

Python LXML.HMTL Xpath返回空列表

来自分类Dev

为什么此xpath在python中使用lxml失败?

来自分类Dev

Python-表单的xpath语法(lxml.html)

来自分类Dev

Python使用lxml xpath从输入元素获取值

来自分类Dev

Python lxml的XPath在<p>标记中找不到<ul>

来自分类Dev

Python Xpath:lxml.etree.XPathEvalError:无效的谓词

来自分类Dev

Python lxml.html xpath不返回任何元素

来自分类Dev

为什么python lxml etree xpath返回多个元素?

来自分类Dev

python lxml xpath:如何使此谓词起作用

来自分类Dev

Python lxml.html xpath不返回任何元素

来自分类Dev

Python LXML HTML xpath查询代码不起作用

来自分类Dev

为什么此xpath在python中使用lxml失败?

来自分类Dev

python中在XML文件上使用lxml的xpath问题

来自分类Dev

Python lxml的XPath在<p>标记中找不到<ul>

来自分类Dev

Python LXML.HMTL Xpath返回空列表

来自分类Dev

使用iterparse编辑和输出xml的python lxml

来自分类Dev

python-使用带有xpath语法的lxml.html解析html表单