DataFrame을 사용하여 웹 페이지에서 데이터 가져 오기

Userabc

DataFrame웹 페이지 ( http://owww.met.hu/eghajlat/eghajlati_adatsorok/bp/Navig/202_EN.htm ) 에서 Python 2.7 용 pandas 사용하여 시계열 데이터를 스크랩하려고합니다 . 누군가 내가 코드를 작성하는 방법을 도와주세요. 감사!

다음과 같이 코드를 시도했습니다.

html =urllib.urlopen("http://owww.met.hu/eghajlat/eghajlati_adatsorok/bp/Navig/202_EN.htm");
text= html.read();
df=pd.DataFrame(index=datum, columns=['m_ta','m_tax','m_taxd', 'm_tan','m_tand'])

그러나 그것은 아무것도주지 않습니다. 여기에 표를 그대로 표시하고 싶습니다.

이스 르엘

BeautifulSoup모든 font태그 를 파싱 한 다음 splitcolumn a, set_indexfrom column idxrename_axisto None-remove 사용할 수 있습니다 index name.

import pandas as pd
import urllib
from bs4 import BeautifulSoup

html = urllib.urlopen("http://owww.met.hu/eghajlat/eghajlati_adatsorok/bp/Navig/202_EN.htm");
soup = BeautifulSoup(html)
#print soup

fontTags = soup.findAll('font')
#print fontTags

#get text from tags fonts
li = [x.text for x in soup.findAll('font')]

#remove first 13 tags, before not contain necessary data 
df = pd.DataFrame(li[13:], columns=['a'])

#split data by arbitrary whitspace 
df = df.a.str.split(r'\s+', expand=True)

#set column names
df.columns = columns=['idx','m_ta','m_tax','m_taxd', 'm_tan','m_tand']

#convert column idx to period
df['idx'] = pd.to_datetime(df['idx']).dt.to_period('M')

#convert columns to datetime
df['m_taxd'] = pd.to_datetime(df['m_taxd'])
df['m_tand'] = pd.to_datetime(df['m_tand'])

#set column idx to index, remove index name
df = df.set_index('idx').rename_axis(None)
print df

         m_ta m_tax     m_taxd  m_tan     m_tand
1901-01  -4.7   5.0 1901-01-23  -12.2 1901-01-10
1901-02  -2.1   3.5 1901-02-06   -7.9 1901-02-15
1901-03   5.8  13.5 1901-03-20    0.6 1901-03-01
1901-04  11.6  18.2 1901-04-10    7.4 1901-04-23
1901-05  16.8  22.5 1901-05-31   12.2 1901-05-05
1901-06  21.0  24.8 1901-06-03   14.6 1901-06-17
1901-07  22.4  27.4 1901-07-30   16.9 1901-07-04
1901-08  20.7  25.9 1901-08-01   14.7 1901-08-29
1901-09  15.9  19.9 1901-09-01   11.8 1901-09-09
1901-10  12.6  17.9 1901-10-04    8.3 1901-10-31
1901-11   4.7  11.1 1901-11-14   -0.2 1901-11-26
1901-12   4.2   8.4 1901-12-22   -1.4 1901-12-07
1902-01   3.4   7.5 1902-01-25   -2.2 1902-01-15
1902-02   2.8   6.6 1902-02-09   -2.8 1902-02-06
1902-03   5.3  13.3 1902-03-22   -3.5 1902-03-13
1902-04  10.5  15.8 1902-04-21    6.1 1902-04-08
1902-05  12.5  20.6 1902-05-31    8.5 1902-05-10
1902-06  18.5  23.8 1902-06-30   14.4 1902-06-19
1902-07  20.2  25.2 1902-07-01   15.5 1902-07-03
1902-08  21.1  25.4 1902-08-07   14.7 1902-08-13
1902-09  16.1  23.8 1902-09-05    9.5 1902-09-24
1902-10  10.8  15.4 1902-10-12    4.9 1902-10-25
1902-11   2.4   9.1 1902-11-01   -4.2 1902-11-18
1902-12  -3.1   7.2 1902-12-27  -17.6 1902-12-15
1903-01  -0.5   8.3 1903-01-11  -11.5 1903-01-23
1903-02   4.6  13.4 1903-02-23   -2.7 1903-02-17
1903-03   9.0  16.1 1903-03-28    4.9 1903-03-09
1903-04   9.0  16.5 1903-04-29    2.6 1903-04-19
1903-05  16.4  21.2 1903-05-03   11.3 1903-05-19
1903-06  19.0  23.1 1903-06-03   15.6 1903-06-07
...       ...   ...        ...    ...        ...
1998-07  22.5  30.7 1998-07-23   15.0 1998-07-09
1998-08  22.3  30.5 1998-08-03   14.8 1998-08-29
1998-09  16.0  21.0 1998-09-12   10.4 1998-09-14
1998-10  11.9  17.2 1998-10-07    8.2 1998-10-27
1998-11   3.8   8.4 1998-11-05   -1.6 1998-11-21
1998-12  -1.6   6.2 1998-12-14   -8.2 1998-12-26
1999-01   0.6   4.7 1999-01-15   -4.8 1999-01-31
1999-02   1.5   6.9 1999-02-05   -4.8 1999-02-01
1999-03   8.2  15.5 1999-03-31    3.0 1999-03-16
1999-04  13.1  17.1 1999-04-16    6.1 1999-04-18
1999-05  17.2  25.2 1999-05-31   11.1 1999-05-06
1999-06  19.8  24.4 1999-06-07   12.2 1999-06-22
1999-07  22.3  28.0 1999-07-06   16.3 1999-07-23
1999-08  20.6  26.7 1999-08-09   17.3 1999-08-23
1999-09  19.3  22.9 1999-09-26   15.0 1999-09-02
1999-10  11.5  19.0 1999-10-03    5.7 1999-10-18
1999-11   3.9  12.6 1999-11-04   -2.2 1999-11-21
1999-12   1.3   6.4 1999-12-13   -8.1 1999-12-25
2000-01  -0.7   8.7 2000-01-31   -6.6 2000-01-25
2000-02   4.5  10.2 2000-02-01   -0.1 2000-02-23
2000-03   6.7  11.6 2000-03-09    0.6 2000-03-17
2000-04  14.8  22.1 2000-04-21    5.8 2000-04-09
2000-05  18.7  23.9 2000-05-27   12.3 2000-05-22
2000-06  21.9  29.3 2000-06-14   15.4 2000-06-17
2000-07  20.3  26.6 2000-07-03   14.0 2000-07-16
2000-08  23.8  29.7 2000-08-20   18.5 2000-08-31
2000-09  16.1  21.5 2000-09-14   12.7 2000-09-24
2000-10  14.1  18.7 2000-10-04    8.0 2000-10-23
2000-11   9.0  14.9 2000-11-15    3.7 2000-11-30
2000-12   3.0   9.4 2000-12-14   -6.8 2000-12-24

[1200 rows x 5 columns]

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

R을 사용하여 웹에서 데이터 가져 오기

분류에서Dev

Jsoup을 사용하여 웹 페이지에서 데이터 가져 오기 빈 결과 반환

분류에서Dev

curl을 사용하여 웹 사이트에서 데이터 가져 오기

분류에서Dev

Java를 사용하여 웹에서 데이터 가져 오기

분류에서Dev

웹 페이지에서 context_processor를 사용하여 테이블에서 열을 배열로 가져 오기

분류에서Dev

Selenium을 사용하여 스크래핑하여 웹 페이지에서 위치 정보 가져 오기

분류에서Dev

Batching을 사용하여 웹 API 대량 데이터 (백만) 가져 오기

분류에서Dev

Python2.7에서 Selenium을 사용하여 웹 사이트 캘린더 데이터 가져 오기

분류에서Dev

웹 사이트의 다음 페이지에서 데이터 가져 오기

분류에서Dev

python-요청을 사용하여 수백 개의 웹 페이지에서 콘텐츠 가져 오기

분류에서Dev

Java에서 API HtmlUnit을 사용하여 로그인 및 웹 페이지 가져 오기

분류에서Dev

Python : 요청을 사용하여 웹 페이지에서 자동 제안 결과 가져 오기

분류에서Dev

웹 인터페이스 가져 오기 기능을 사용하여 생성 된 github 저장소 업데이트

분류에서Dev

요청을 사용하여 콘텐츠 웹 페이지 가져 오기

분류에서Dev

BeautifulSoup을 사용하여 웹 사이트에서 테이블 가져 오기

분류에서Dev

Python을 사용하여 웹 사이트에서 모든 URL 가져 오기

분류에서Dev

cUrl을 사용하여 다른 웹 사이트에서 쿠키 가져 오기

분류에서Dev

Python을 사용하여 Grakn에서 데이터 가져 오기

분류에서Dev

findObjectsInBackgroundWithBlock을 사용하여 Parse에서 데이터 가져 오기

분류에서Dev

PHP의 웹 페이지에서 데이터 가져 오기

분류에서Dev

페이지가 완전히로드 된 후 값을로드하는 웹 사이트에서 JSOUP 데이터 가져 오기

분류에서Dev

WebRequest를 사용하여 VB.net의 웹 페이지에서 특정 태그 값을 가져 오는 방법

분류에서Dev

WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

분류에서Dev

HttpClient를 사용하여 웹 페이지에서 "제목"을 가져 오는 방법

분류에서Dev

Google 웹 로그 분석-보기 필터에 사용 된 맞춤 측정 기준의 가져 오기 기능을 사용하여 이전 데이터 변경

분류에서Dev

Microsoft Azure-내 웹앱에서 사용자 지정 도메인을 사용하여 404 페이지 가져 오기

분류에서Dev

DOM XPATH를 사용하여 웹 페이지에서 배경 이미지 가져 오기

분류에서Dev

데이터베이스에서 BLOB를 가져 오는 최대 절전 모드를 사용하여 JSP를 사용하여 웹 페이지에 표시

분류에서Dev

파이썬을 사용하여 웹 페이지 본문의 내용 가져 오기

Related 관련 기사

  1. 1

    R을 사용하여 웹에서 데이터 가져 오기

  2. 2

    Jsoup을 사용하여 웹 페이지에서 데이터 가져 오기 빈 결과 반환

  3. 3

    curl을 사용하여 웹 사이트에서 데이터 가져 오기

  4. 4

    Java를 사용하여 웹에서 데이터 가져 오기

  5. 5

    웹 페이지에서 context_processor를 사용하여 테이블에서 열을 배열로 가져 오기

  6. 6

    Selenium을 사용하여 스크래핑하여 웹 페이지에서 위치 정보 가져 오기

  7. 7

    Batching을 사용하여 웹 API 대량 데이터 (백만) 가져 오기

  8. 8

    Python2.7에서 Selenium을 사용하여 웹 사이트 캘린더 데이터 가져 오기

  9. 9

    웹 사이트의 다음 페이지에서 데이터 가져 오기

  10. 10

    python-요청을 사용하여 수백 개의 웹 페이지에서 콘텐츠 가져 오기

  11. 11

    Java에서 API HtmlUnit을 사용하여 로그인 및 웹 페이지 가져 오기

  12. 12

    Python : 요청을 사용하여 웹 페이지에서 자동 제안 결과 가져 오기

  13. 13

    웹 인터페이스 가져 오기 기능을 사용하여 생성 된 github 저장소 업데이트

  14. 14

    요청을 사용하여 콘텐츠 웹 페이지 가져 오기

  15. 15

    BeautifulSoup을 사용하여 웹 사이트에서 테이블 가져 오기

  16. 16

    Python을 사용하여 웹 사이트에서 모든 URL 가져 오기

  17. 17

    cUrl을 사용하여 다른 웹 사이트에서 쿠키 가져 오기

  18. 18

    Python을 사용하여 Grakn에서 데이터 가져 오기

  19. 19

    findObjectsInBackgroundWithBlock을 사용하여 Parse에서 데이터 가져 오기

  20. 20

    PHP의 웹 페이지에서 데이터 가져 오기

  21. 21

    페이지가 완전히로드 된 후 값을로드하는 웹 사이트에서 JSOUP 데이터 가져 오기

  22. 22

    WebRequest를 사용하여 VB.net의 웹 페이지에서 특정 태그 값을 가져 오는 방법

  23. 23

    WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

  24. 24

    HttpClient를 사용하여 웹 페이지에서 "제목"을 가져 오는 방법

  25. 25

    Google 웹 로그 분석-보기 필터에 사용 된 맞춤 측정 기준의 가져 오기 기능을 사용하여 이전 데이터 변경

  26. 26

    Microsoft Azure-내 웹앱에서 사용자 지정 도메인을 사용하여 404 페이지 가져 오기

  27. 27

    DOM XPATH를 사용하여 웹 페이지에서 배경 이미지 가져 오기

  28. 28

    데이터베이스에서 BLOB를 가져 오는 최대 절전 모드를 사용하여 JSP를 사용하여 웹 페이지에 표시

  29. 29

    파이썬을 사용하여 웹 페이지 본문의 내용 가져 오기

뜨겁다태그

보관