안녕하세요 저는 파이썬에서 셀레늄을 사용하여 여러 페이지를 긁으려고합니다. 나는 스팬 클래스 요소에 속하는 모든 요소를 추출하는 데 관심이 있습니다. 기본적으로 제가하고 싶은 것은 스팬 클래스 요소를 얻은 다음 그 안에서 링크를 추출하는 것입니다. 각 페이지에 대해 xpath를 사용하여이를 달성 할 수 있지만 xpath는 각 개체 및 각 페이지에 대해 변경됩니다. 다음은 웹 요소가 어떻게 보이는지에 대한 예입니다.
본질적으로 나는 스크래핑 할 모든 페이지에서 일관된 요소를 추출하고 싶습니다. 그래서 내 생각은 이러한 요소를 얻은 다음 이러한 요소에 대한 href 요소를 얻는 것입니다. 이 코드를 사용하여 페이지의 모든 요소를 가져 오려고했습니다.
driver.find_elements_by_xpath("//span[@class='Text__StyledText-jknly0-0 cCEhaW']")
그러나 이것은 작동하지 않았으며 아무것도 반환하지 않습니다. 또한 페이지마다 다르기 때문에 내부 클래스를 사용하고 싶지 않으므로 너무 지저분하지 않고 스크 레이 핑을 자동화하려는 경우 사용할 실제 요소는 내가 언급 한 요소입니다. 페이지에서이 범위 클래스 요소에 대한 링크를 추출하는 방법이 있습니까?
이 xpath 시도
//span[contains(@class,'Text__StyledText')]//a[contains(@class,'Anchor__StyledAnchor')]
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다