특정 병원이 다른 응용 프로그램에 공급할 수있는 선별 대기 시간을 추출하려고합니다. 모든 지역 병원의 데이터는 https://www.health.wa.gov.au/emergencyactivity/EDdata/edsv/ 에서 확인할 수 있습니다.
지금까지 내가 한 진전은 다음과 같습니다.
import requests
from bs4 import BeautifulSoup
URL = 'https://www.health.wa.gov.au/emergencyactivity/EDdata/edsv/'
headers = {
"User-Agent": 'Mozilla/5.0 (X11; Linux x86_64; rv:76.0) Gecko/20100101 Firefox/76.0'
}
page = requests.get(URL, headers=headers)
soup = BeautifulSoup(page.content, 'html.parser')
table_rows = soup.find_all('tr')
for tr in table_rows:
td = tr.find_all('td')
row = [i.text for i in td]
print(row)
Sir Charles Gairdner Hospital에 대한 분류 시간 만 추출하고 싶지만 그 방법에 대한 단서가 없습니다. 어떤 도움이라도 대단히 감사하겠습니다!
거의 다 왔습니다. 다음과 같이 시도하십시오.
from bs4 import Tag
table_rows = soup.select('tr td')
for tr in table_rows:
if tr.text == 'Sir Charles Gairdner Hospital':
for ns in tr.next_siblings:
if isinstance(ns,Tag):
print(ns.text)
또 다른 대안 :
table = soup.select('table')[0]
for row in table:
if isinstance(row,Tag):
tds = row.select('td')
if len(tds)>0 and tds[0].text=='Sir Charles Gairdner Hospital':
for td in tds:
print(td.text)
산출:
73
5
36
편집 : 해당 위치에 대한 심사 대기 시간 만 인쇄하려면 다음을 사용하십시오.
for tr in table_rows:
if tr.text == 'Sir Charles Gairdner Hospital':
print(tr.next_sibling.text) #note: it's "next_sibling", not "siblings" this time
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다