硒找到具有两个div的所有元素

debugcn 发表于 Dev

用户名

我正在尝试从网站收集文本和图像，以帮助收集与失踪人员相关的推文。这是问题所在：

有些推文没有图片，因此对应的<div class='c' ....>只有一条<div>...</div>。有些tweet包含图片，因此相应的tweet包含<div class='c' ....>两个<div>...</div>，如以下代码所示：

<div class='c' id="M_D*****">
  <div>...</div>

和

<div class='c' id="M_D*****">
  <div>...</div>
  <div>...</div>

我打算检查一条推文是否有图像，即找出对应的图像是否<div class='c' ....>有两个<div>...</div>。

PS：以下代码用于收集所有文本和图像URL，但并非所有推文都具有图像，因此我想通过解决上述问题来进行匹配。

tweets = browser.find_elements_by_xpath("//span[@class='ctt']")
graph_links = browser.find_elements_by_xpath("//img[@alt='img' and @class='ib']")

这是一项公益计划，旨在帮助失踪人员返回家园。

杰夫

通过分别收集文本和图像，我认为事后将文本与相关图像进行匹配将是不可能的。我建议采用另一种方法。我将搜索<div class='c'...>包含文本和可选图像的。一旦有了“容器” DIV，就可以获取文本，查看是否存在图像并将它们放在一起。如果没有所有相关的HTML，您可能需要调整下面的代码，但是它应该使您了解如何实现此目的。

containers = browser.find_elements_by_css_selector("div.c")
for container in containers:
    print container.find_element_by_css_selector("span.ctt").text // the tweet text
    images = container.find_elements_by_css_selector("img.ib")
    if len(images) > 0 // see if the image exists
        print images[0].get_attribute("src") // the URL of the image
    print "-------------" // separator between tweets

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-22

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

硒找到具有两个div的所有元素

硒找到具有两个div的所有元素

R：来自具有两个条件的元素向量的所有长度的所有组合

具有两个元素的列表

选择所有具有相同类的元素，有些元素有两个类

如何找到同一数组中包含所有元音的两个元素

如何在Python中找到两个向量具有相等元素的索引集

在有向图中找到具有权重限制的两个顶点之间的所有路径

如何在div中找到具有相同类的最后两个元素并为其分配一个类？

使用Bash，如何找到具有两个目录的所有目录并将它们移至复制的树形结构？

隐藏所有div元素，但显示前两个

如何对具有相同ID的两个div containsig元素使用通用js函数？

从两个列表中获取元素的所有组合？

如何使两个JComboBox具有相同的元素？

具有顺序限制的两个列表的元素的排列

检查两个列表是否具有相同的元素

如何使两个输入元素同时具有焦点？

使两个宽度可变的元素具有相同的宽度

区分具有相同类的两个html元素

检查两个列表是否具有公共元素

使两个向量具有相同数量的元素

区分具有相同类的两个html元素

Scala：获取具有两个限制的列表元素

如何选择具有某些两个祖先的元素？

如何计算具有两个“限制”的元素？

在Java中从两个不同的数组列表对象中找到不常见的通用所有元素

使两个平行的<div>列具有相同的高度

滚动两个div具有停靠效果

使两个DIV具有相同的高度？

合并具有相同渐变背景的两个div

使两个DIV具有相同的高度？