我需要在window.open('/ echipa / lok-moscova / Sjs63WfK')之后获得该部分,并将其作为此Web元素中带有硒的字符串,但我真的不知道该怎么做。如果我能做到。
<a href="#" class="participant-imglink" onclick="window.open('/echipa/lok-moscova/Sjs63WfK'); return false;">Lok. Moscova</a>
这是BeautifulSoup的示例(您可以从硒页面源创建汤对象):
import re
from bs4 import BeautifulSoup
txt = '''
<a href="#" class="participant-imglink" onclick="window.open('/echipa/lok-moscova/Sjs63WfK'); return false;">Lok. Moscova</a>
'''
soup = BeautifulSoup(txt, 'html.parser')
link = soup.select_one('a.participant-imglink[onclick]')
url = re.search(r"window\.open\('(.*?)'\)", link['onclick']).group(1)
print(url)
印刷品:
/echipa/lok-moscova/Sjs63WfK
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句