如何使用python和selenium IDE获取网页上的所有链接

穆克什

我想使用硒ide和python从网页获取所有链接。

例如,如果我搜索测试或Google网站上的任何内容,并且希望所有与此相关的链接。

这是我的代码

 from selenium import webdriver
from selenium.webdriver.common.keys import Keys
baseurl="https://www.google.co.in/?gws_rd=ssl"
driver = webdriver.Firefox()
driver.get(baseurl)
driver.find_element_by_id("lst-ib").click()
driver.find_element_by_id("lst-ib").clear()
driver.find_element_by_id("lst-ib").send_keys("test") 
link_name=driver.find_element_by_xpath(".//*[@id='rso']/div[2]/li[2]/div/h3/a")
print link_name
driver.close()

输出

 <selenium.webdriver.remote.webelement.WebElement object at 0x7f0ba50c2090>

$x(".//*[@id='rso']/div[2]/li[2]/div/h3/a")在Firebug的控制台中使用xpath

输出[一个jtypes2.asp]

如何从对象获取链接内容。

塔凡
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
baseurl="https://www.google.co.in/?gws_rd=ssl"
driver = webdriver.Firefox()
driver.get(baseurl)
driver.find_element_by_id("lst-ib").click()
driver.find_element_by_id("lst-ib").clear()
driver.find_element_by_id("lst-ib").send_keys("test")
driver.find_element_by_id("lst-ib").send_keys(Keys.RETURN)
driver.implicitly_wait(2)
link_name=driver.find_elements_by_xpath(".//*[@id='rso']/div/li/div/h3/a")
for link in link_name:
    print link.get_attribute('href')

试试上面的代码。输入搜索关键字后,您的代码不会发送RETURN键。另外,我还进行了更改,以隐式等待2秒以加载搜索结果,并且更改了xpath以获取所有链接。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python 和 selenium - 从网页获取所有链接

来自分类Dev

使用RSelenium获取网页中的所有Twitter链接

来自分类Dev

如何导出网页上的所有超链接?

来自分类Dev

Selenium 如何快速获取网页上所有元素的大小和位置

来自分类Dev

如何使用Selenium和Python从元素获取链接

来自分类Dev

Python + 网页抓取 + scrapy:如何从 IMDb 页面获取所有电影的链接?

来自分类Dev

如何使用PHP访问网页上特定类的所有链接

来自分类Dev

如何使用PHP访问网页上特定类的所有链接

来自分类Dev

如何以纯文本格式提取网页上的所有URL(链接)?

来自分类Dev

如何使用Python Selenium和BeautifulSoup从网络上刮掉所有<li>文本?

来自分类Dev

如何使用Python和Selenium获得链接的onclick“操作”?

来自分类Dev

使用 vbscript 获取网页上具有特定 SRC 值的所有图像

来自分类Dev

如何使用Selenium和Python从列表中获取特定元素

来自分类Dev

如何使用Selenium和Python获取元素的href属性

来自分类Dev

如何使用python和selenium获取子元素数据?

来自分类Dev

如何从网页获取所有文本?

来自分类Dev

如何禁用网页上的所有导航?

来自分类Dev

如何迭代 BeautifulSoup 以从站点上的所有表单中获取所有操作(链接)?

来自分类Dev

如何使用python直接或间接链接到网页的所有链接?

来自分类Dev

如何使用python和selenium检查网页上是否存在文本(不是源)?

来自分类Dev

如何使用 Selenium 和 Python 3.6 在网页上定位元素

来自分类Dev

如何下载完整的网页(包括CSS,JS和图像)以及所有链接的网页

来自分类Dev

Python-使用Selenium获取新网页的链接

来自分类Dev

如何获取所有图像链接并使用python下载

来自分类Dev

如何正确编写从网页中提取所有链接的程序?

来自分类Dev

如何使用Java和Selenium计算网页上的元素

来自分类Dev

如何获取网页中的所有单词 - Python3

来自分类Dev

如何使用Robot Framework获取网页元素的所有xpath?

来自分类Dev

如何使用Python退出通过GeckoDriver和Selenium启动的所有Firefox进程

Related 相关文章

  1. 1

    Python 和 selenium - 从网页获取所有链接

  2. 2

    使用RSelenium获取网页中的所有Twitter链接

  3. 3

    如何导出网页上的所有超链接?

  4. 4

    Selenium 如何快速获取网页上所有元素的大小和位置

  5. 5

    如何使用Selenium和Python从元素获取链接

  6. 6

    Python + 网页抓取 + scrapy:如何从 IMDb 页面获取所有电影的链接?

  7. 7

    如何使用PHP访问网页上特定类的所有链接

  8. 8

    如何使用PHP访问网页上特定类的所有链接

  9. 9

    如何以纯文本格式提取网页上的所有URL(链接)?

  10. 10

    如何使用Python Selenium和BeautifulSoup从网络上刮掉所有<li>文本?

  11. 11

    如何使用Python和Selenium获得链接的onclick“操作”?

  12. 12

    使用 vbscript 获取网页上具有特定 SRC 值的所有图像

  13. 13

    如何使用Selenium和Python从列表中获取特定元素

  14. 14

    如何使用Selenium和Python获取元素的href属性

  15. 15

    如何使用python和selenium获取子元素数据?

  16. 16

    如何从网页获取所有文本?

  17. 17

    如何禁用网页上的所有导航?

  18. 18

    如何迭代 BeautifulSoup 以从站点上的所有表单中获取所有操作(链接)?

  19. 19

    如何使用python直接或间接链接到网页的所有链接?

  20. 20

    如何使用python和selenium检查网页上是否存在文本(不是源)?

  21. 21

    如何使用 Selenium 和 Python 3.6 在网页上定位元素

  22. 22

    如何下载完整的网页(包括CSS,JS和图像)以及所有链接的网页

  23. 23

    Python-使用Selenium获取新网页的链接

  24. 24

    如何获取所有图像链接并使用python下载

  25. 25

    如何正确编写从网页中提取所有链接的程序?

  26. 26

    如何使用Java和Selenium计算网页上的元素

  27. 27

    如何获取网页中的所有单词 - Python3

  28. 28

    如何使用Robot Framework获取网页元素的所有xpath?

  29. 29

    如何使用Python退出通过GeckoDriver和Selenium启动的所有Firefox进程

热门标签

归档