如果具有以下html:
</br></td>, <td class="first">TEXT_1a<br>TEXT_1b
</br></td>, <td class="first">TEXT_2a<br>TEXT_2b
</br></td>, <td class="first">TEXT_3a<br>TEXT_3b
</br></td>, <td class="first">TEXT_4a<br>TEXT_4b
</br></td>, <td class="first">TEXT_5a<br>TEXT_5b
</br></td>, <td class="first">TEXT_6a<br>TEXT_6b
我用了
[i.text.strip() for i in soup.select('td.first')]
但是,我得到了
['TEXT_1aTEXT_1b', 'TEXT_2aTEXT_2b', 'TEXT_3aTEXT_3b', 'TEXT_4aTEXT_4b', 'TEXT_5aTEXT_5b', 'TEXT_6aTEXT_6b']
如何删除TEXT_1b,TEXT_2b ... TEXT_nb。另外,我不希望有一个数组,但是N1 = TEXT_1a,N2 = TEXT_2a ... Nn = TEXT_na
我认为您可以使用:
[i.contents[0].strip() for i in soup.select('td.first')]
关于问题的第二部分-您想在各个变量中使用字段吗?您可以做到,但这可能不是一个好主意。有什么理由吗?
要么,您知道其中有多少个,在这种情况下,您可以执行以下操作:
n1, n2, n3, ...nN = [i.contents[0].strip() for i in soup.select('td.first')]
否则您就不知道了,在这种情况下,数组(Python中的列表)确实是唯一有意义的东西。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句