BeautifulSoup을 사용하여 Google을 검색하고 첫 번째 링크를 열고 싶습니다. 그러나 링크를 열면 오류가 표시됩니다. 내가 생각하는 이유는 Google이 웹 사이트의 정확한 링크를 제공하지 않기 때문에 URL에 여러 매개 변수를 추가했기 때문입니다. 정확한 URL을 얻는 방법?
인용 태그 를 사용하려고 할 때 작동했지만 큰 URL의 경우 생성 문제가 발생했습니다.
난 soup.h3.a을 사용하여 얻는 제 링크 [ 'HREF'] [7]은 ' http://www.wikipedia.com/wiki/White_holes&sa=U&ved=0ahUKEwi_oYLLm_rUAhWJNI8KHa5SClsQFggbMAI&usg=AFQjCNGN-vlBvbJ9OPrnq40d0_b8M0KFJQ '
내 코드는 다음과 같습니다.
import requests
from bs4 import Beautifulsoup
r = requests.get('https://www.google.com/search?q=site:wikipedia.com+Black+hole&gbv=1&sei=YwHNVpHLOYiWmQHk3K24Cw')
soup = BeautifulSoup(r.text, "html.parser")
print(soup.h3.a['href'][7:])
반환 된 문자열을 분할 할 수 있습니다.
url = soup.h3.a['href'][7:].split('&')
print(url[0])
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다