Python // BS4 //标签

RC_Data

如果具有以下html:

</br></td>, <td class="first">TEXT_1a<br>TEXT_1b
                            </br></td>, <td class="first">TEXT_2a<br>TEXT_2b
                            </br></td>, <td class="first">TEXT_3a<br>TEXT_3b
                            </br></td>, <td class="first">TEXT_4a<br>TEXT_4b
                            </br></td>, <td class="first">TEXT_5a<br>TEXT_5b
                            </br></td>, <td class="first">TEXT_6a<br>TEXT_6b

我用了

[i.text.strip() for i in soup.select('td.first')]

但是,我得到了

   ['TEXT_1aTEXT_1b', 'TEXT_2aTEXT_2b', 'TEXT_3aTEXT_3b', 'TEXT_4aTEXT_4b', 'TEXT_5aTEXT_5b', 'TEXT_6aTEXT_6b']

如何删除TEXT_1b,TEXT_2b ... TEXT_nb。另外,我不希望有一个数组,但是N1 = TEXT_1a,N2 = TEXT_2a ... Nn = TEXT_na

艾丹·凯恩(Aidan Kane)

我认为您可以使用:

[i.contents[0].strip() for i in soup.select('td.first')]

关于问题的第二部分-您想在各个变量中使用字段吗?您可以做到,但这可能不是一个好主意。有什么理由吗?

要么,您知道其中有多少个,在这种情况下,您可以执行以下操作:

n1, n2, n3, ...nN = [i.contents[0].strip() for i in soup.select('td.first')]

否则您就不知道了,在这种情况下,数组(Python中的列表)确实是唯一有意义的东西。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python bs4删除br标签

来自分类Dev

Python bs4删除br标签

来自分类Dev

选择BS4 Python上的特定标签

来自分类Dev

Python / bs4:div标签内的跨度-文本提取

来自分类Dev

使用BS4和Python提取异常的XML标签

来自分类Dev

BS4:删除<a>标签

来自分类Dev

如何使用 bs4/python 访问标头标签(即 <h1>)下方的标签

来自分类Dev

Python BS4抓取表在<td>标签中具有多个值

来自分类Dev

如何使用bs4或lxml获取在Python中找到XML标签的文本行?

来自分类Dev

Python2.7 使用 bs4 获取下一个标签

来自分类Dev

如何使用 Python BS4 访问 HTML <p> 标签内的文本

来自分类Dev

BS4:在标签中获取文本

来自分类Dev

BS4获取XML标签变量

来自分类Dev

Web Scraping,如何在python中使用bs4从两个相同的标签中提取数据

来自分类Dev

在bs4的新标签内包装找到的标签

来自分类Dev

修剪python bs4中的空白

来自分类Dev

Trimming white spaces in python bs4

来自分类Dev

修剪刮下的文本-Python / bs4

来自分类Dev

修剪python bs4中的空白

来自分类Dev

带有SDMX的Python BS4

来自分类Dev

使用 bs4 解析 Python

来自分类Dev

获取以标签/ BS4分隔的文本

来自分类Dev

BS4返回[],而不是所需的HTML标签

来自分类Dev

如何使用bs4在p标签中获取文本

来自分类Dev

带有标题标签的BS4类

来自分类Dev

BS4 replace_with用于替换新标签

来自分类Dev

bs4可用于在<span>标签内获取数据

来自分类Dev

BS4从<br>标签获取信息

来自分类Dev

在BS4中按文本查找HTML标签