특정 웹 페이지 ( "비트 코인")에 대한 Wikipedia 페이지보기 통계에서 지난 5 년 동안 시계열 데이터를 수집하려고합니다. 이 사이트가 유용하다는 것을 알았습니다. http://stats.grok.se 에서이 데이터를 얻었습니다. 두 가지 문제 :
웹 사이트는 데이터를 가져올 연도로 2016이 선택 될 때마다 "내부 서버 오류"오류를 트리거합니다.
이 출력을 .csv와 같이 더 유용한 형식으로 만들 수있는 기존 도구가 있습니까?
stats.grok.se가 wikimedia 프로덕션 또는 랩 서버에 존재하지 않는 것처럼 보이기 때문에 저는 모릅니다. 하지만 2015 년 7 월부터 페이지 조회 통계를 위해 제공되는 API가 있습니다.
예 : 작년 에 https://en.wikipedia.org/wiki/Bitcoin 에 대한 일일 페이지보기 : https://wikimedia.org/api/rest_v1/metrics/pageviews/per-article/en.wikipedia.org/ 모든 액세스 / 모든 에이전트 / Bitcoin / daily / 20151105 / 20161105
올 액세스 = desktop + mobile-web + mobile-app
모든 에이전트 = user + spider + bot
과거 데이터는 https://dumps.wikimedia.org/other/pagecounts-raw/ 에서 다운로드 할 수 있습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다