搜索

搜索

如何使用python和selenium IDE获取网页上的所有链接

Mukesh 发表于 Dev

16

穆克什

我想使用硒ide和python从网页获取所有链接。

例如，如果我搜索测试或Google网站上的任何内容，并且希望所有与此相关的链接。

这是我的代码

 from selenium import webdriver
from selenium.webdriver.common.keys import Keys
baseurl="https://www.google.co.in/?gws_rd=ssl"
driver = webdriver.Firefox()
driver.get(baseurl)
driver.find_element_by_id("lst-ib").click()
driver.find_element_by_id("lst-ib").clear()
driver.find_element_by_id("lst-ib").send_keys("test") 
link_name=driver.find_element_by_xpath(".//*[@id='rso']/div[2]/li[2]/div/h3/a")
print link_name
driver.close()

输出

 <selenium.webdriver.remote.webelement.WebElement object at 0x7f0ba50c2090>

$x(".//*[@id='rso']/div[2]/li[2]/div/h3/a")在Firebug的控制台中使用xpath 。

输出[一个jtypes2.asp]

如何从对象获取链接内容。

塔凡

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
baseurl="https://www.google.co.in/?gws_rd=ssl"
driver = webdriver.Firefox()
driver.get(baseurl)
driver.find_element_by_id("lst-ib").click()
driver.find_element_by_id("lst-ib").clear()
driver.find_element_by_id("lst-ib").send_keys("test")
driver.find_element_by_id("lst-ib").send_keys(Keys.RETURN)
driver.implicitly_wait(2)
link_name=driver.find_elements_by_xpath(".//*[@id='rso']/div/li/div/h3/a")
for link in link_name:
    print link.get_attribute('href')

试试上面的代码。输入搜索关键字后，您的代码不会发送RETURN键。另外，我还进行了更改，以隐式等待2秒以加载搜索结果，并且更改了xpath以获取所有链接。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-20

0

我来说两句

0条评论

登录后参与评论

上一篇：如何检测QLabel中的文本何时更改？

相关文章

来自分类Dev

Python 和 selenium - 从网页获取所有链接

来自分类Dev

使用RSelenium获取网页中的所有Twitter链接

来自分类Dev

如何导出网页上的所有超链接？

来自分类Dev

Selenium 如何快速获取网页上所有元素的大小和位置

来自分类Dev

如何使用Selenium和Python从元素获取链接

来自分类Dev

Python + 网页抓取 + scrapy：如何从 IMDb 页面获取所有电影的链接？

来自分类Dev

如何使用PHP访问网页上特定类的所有链接

来自分类Dev

如何使用PHP访问网页上特定类的所有链接

来自分类Dev

如何以纯文本格式提取网页上的所有URL（链接）？

来自分类Dev

如何使用Python Selenium和BeautifulSoup从网络上刮掉所有<li>文本？

来自分类Dev

如何使用Python和Selenium获得链接的onclick“操作”？

来自分类Dev

使用 vbscript 获取网页上具有特定 SRC 值的所有图像

来自分类Dev

如何使用Selenium和Python从列表中获取特定元素

来自分类Dev

如何使用Selenium和Python获取元素的href属性

来自分类Dev

如何使用python和selenium获取子元素数据？

来自分类Dev

如何从网页获取所有文本？

来自分类Dev

如何禁用网页上的所有导航？

来自分类Dev

如何迭代 BeautifulSoup 以从站点上的所有表单中获取所有操作（链接）？

来自分类Dev

如何使用python直接或间接链接到网页的所有链接？

来自分类Dev

如何使用python和selenium检查网页上是否存在文本（不是源）？

来自分类Dev

如何使用 Selenium 和 Python 3.6 在网页上定位元素

来自分类Dev

如何下载完整的网页（包括CSS，JS和图像）以及所有链接的网页

来自分类Dev

Python-使用Selenium获取新网页的链接

来自分类Dev

如何获取所有图像链接并使用python下载

来自分类Dev

如何正确编写从网页中提取所有链接的程序？

来自分类Dev

如何使用Java和Selenium计算网页上的元素

来自分类Dev

如何获取网页中的所有单词 - Python3

来自分类Dev

如何使用Robot Framework获取网页元素的所有xpath？

来自分类Dev

如何使用Python退出通过GeckoDriver和Selenium启动的所有Firefox进程

Related 相关文章

文章

热门标签

归档