다음 URL에서 날짜를 구문 분석하고 싶습니다.
URL = 'https : //www.vrbo.com/el-gr/%CE%B5%CE%BD%CE%BF%CE%B9%CE%BA%CE%B9%CE%AC%CF%83% CE % B5 % CE % B9 % CF % 82 % CE % B5 % CE % BE % CE % BF % CF % 87 % CE % B9 % CE % BA % CF % 8E % CE % BD- % CE % BA % CE % B1 % CF % 84 % CE % BF % CE % B9 % CE % BA % CE % B9 % CF % 8E % CE % BD / p436144? AdultsCount = 2 & 도착 = 2021-05-08 & 출발 = 2021- 05-16 '
이것이 내가 시도한 것입니다.
arrival_date = re.split('arrival=',url)
print(arrival_date[1])
정규식을 사용할 수 있습니다. (\d{4}-\d{2}-\d{2})
즉, "4 자리 -2 자리 -2 자리"를 의미합니다.
import re
url = 'https://www.vrbo.com/el-gr/%CE%B5%CE%BD%CE%BF%CE%B9%CE%BA%CE%B9%CE%AC%CF%83%CE%B5%CE%B9%CF%82-%CE%B5%CE%BE%CE%BF%CF%87%CE%B9%CE%BA%CF%8E%CE%BD-%CE%BA%CE%B1%CF%84%CE%BF%CE%B9%CE%BA%CE%B9%CF%8E%CE%BD/p436144?adultsCount=2&arrival=2021-05-08&departure=2021-05-16'
date_regex = r"(\d{4}-\d{2}-\d{2})"
arrival_date = re.search(r"arrival=" + date_regex, url).group(1)
departure_date = re.search(r"departure=" + date_regex, url).group(1)
print(arrival_date) # 2021-05-08
print(departure_date) # 2021-05-16
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다