Ruby 및 Nokogiri로 HTML 테이블 스크래핑

미란다

그래서 저는 총기 사고 / 사망 데이터가있는 웹 사이트에서 데이터를 긁어내는 프로젝트를 진행하고 있습니다. 웹 사이트는 다음과 같습니다. http://www.gunviolencearchive.org/officer-involved-shootings

나는 각 테이블 행을 잡고 해당 행의 데이터로 객체 (인스턴스?, 루비를 처음 사용)를 만들고 콘솔에 출력하려고합니다. 현재 @occurances 배열은 동일한 데이터의 배열을 26 번 반환합니다. 분명히 첫 번째 행으로 덮어 씁니다. 이러한 각 인스턴스를 어떻게 저장하도록 제안 하시겠습니까?

내 코드는 다음과 같습니다. (선택)은 웹 사이트 주소입니다.

 def self.data_from_choice(choice)
        doc = Nokogiri::HTML(open(choice))
        @occurances = []
        doc.xpath("//tr").each do |x|
          date = doc.css("td")[0].text
          state = doc.css("td")[1].text
          city = doc.css("td")[2].text
          deaths = doc.css("td")[4].text
          injured = doc.css("td")[5].text
          source = doc.search(".links li.last a").attr("href").value
          @occurances << {:date => date, :state => state, :city => city, :deaths => deaths, :injured => injured, :source => source}
        end
        puts @occurances
      end
매트

각 행의 루프에서 doc.css(...). 이렇게하면 매번 문서의 맨 위에서 (예 :에서 doc) 검색이 수행됩니다. 내가 원하는 것은 x변수 에있는 행을 기준으로 검색하는 것 입니다.

따라서 이것을 변경하십시오.

date = doc.css("td")[0].text

이에

date = x.css("td")[0].text

유사위한 state, city

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Nokogiri로 여러 테이블 행 형제 스크래핑

분류에서Dev

HTML 테이블 스크래핑-Python

분류에서Dev

Python으로 데이터 스크래핑 및 DevTools와 다른 HTML 트리 수신

분류에서Dev

Ruby on Rails 및 html 테이블 기능

분류에서Dev

Python으로 테이블 스크래핑

분류에서Dev

Path로 테이블 스크래핑

분류에서Dev

html을 사용하여 url 및 스크랩 테이블로 이동

분류에서Dev

파이썬을 사용하여 html 테이블 스크래핑

분류에서Dev

웹 스크래핑, html 테이블 페이지 매김

분류에서Dev

BS4를 사용하여 HTML 테이블 스크래핑

분류에서Dev

Cheerio에서 HTML 테이블을 웹 스크래핑

분류에서Dev

이미지 스크래핑 및 서버로 보내기

분류에서Dev

Python 2.7 및 Beautifulsoup 4로 웹 사이트 스크래핑

분류에서Dev

스타일 테이블 CSS 및 HTML

분류에서Dev

BeautifulSoup 4.8.2로 웹 사이트에서 테이블 스크래핑

분류에서Dev

Python에서 BeautifulSoup4로 html 스크래핑 및 동일한 태그 구별

분류에서Dev

HTML에서 Ruby on Rails로 : 링크 및 이미지 태그

분류에서Dev

테이블을 목록으로 웹 스크래핑

분류에서Dev

테이블 <table>의 다중 테이블 헤더 <thead> 및 <thead>에서 데이터를 테이블 행으로 스크 레이 핑하는 방법

분류에서Dev

CSS 및 HTML : 마우스 추적으로 테이블 영역 표시

분류에서Dev

Python 및 BeautifulSoup으로 웹 스크래핑

분류에서Dev

dryscrape 및 BeautifulSoup으로 웹 스크래핑

분류에서Dev

Ruby에서 HTML 웹 스크래핑의 텍스트로 배열을 채우는 방법

분류에서Dev

BeautifulSoup으로 테이블 헤더를 스크래핑하는 동안 ".text"를 사용하여 원하지 않는 HTML을 제거 할 수없는 이유

분류에서Dev

Ruby와 Nokogiri 구문 분석 테이블?

분류에서Dev

R로 소스 HTML이 아닌 실제 페이지 스크래핑 화면

분류에서Dev

BeautifulSoup을 사용하여 HTML 테이블에서 하나의 열 스크래핑

분류에서Dev

R의 웹 스크래핑 : HTML 테이블 구문 분석 문제

분류에서Dev

HTML 테이블 스크래핑 – 열에서 href 속성 가져 오기

Related 관련 기사

  1. 1

    Nokogiri로 여러 테이블 행 형제 스크래핑

  2. 2

    HTML 테이블 스크래핑-Python

  3. 3

    Python으로 데이터 스크래핑 및 DevTools와 다른 HTML 트리 수신

  4. 4

    Ruby on Rails 및 html 테이블 기능

  5. 5

    Python으로 테이블 스크래핑

  6. 6

    Path로 테이블 스크래핑

  7. 7

    html을 사용하여 url 및 스크랩 테이블로 이동

  8. 8

    파이썬을 사용하여 html 테이블 스크래핑

  9. 9

    웹 스크래핑, html 테이블 페이지 매김

  10. 10

    BS4를 사용하여 HTML 테이블 스크래핑

  11. 11

    Cheerio에서 HTML 테이블을 웹 스크래핑

  12. 12

    이미지 스크래핑 및 서버로 보내기

  13. 13

    Python 2.7 및 Beautifulsoup 4로 웹 사이트 스크래핑

  14. 14

    스타일 테이블 CSS 및 HTML

  15. 15

    BeautifulSoup 4.8.2로 웹 사이트에서 테이블 스크래핑

  16. 16

    Python에서 BeautifulSoup4로 html 스크래핑 및 동일한 태그 구별

  17. 17

    HTML에서 Ruby on Rails로 : 링크 및 이미지 태그

  18. 18

    테이블을 목록으로 웹 스크래핑

  19. 19

    테이블 <table>의 다중 테이블 헤더 <thead> 및 <thead>에서 데이터를 테이블 행으로 스크 레이 핑하는 방법

  20. 20

    CSS 및 HTML : 마우스 추적으로 테이블 영역 표시

  21. 21

    Python 및 BeautifulSoup으로 웹 스크래핑

  22. 22

    dryscrape 및 BeautifulSoup으로 웹 스크래핑

  23. 23

    Ruby에서 HTML 웹 스크래핑의 텍스트로 배열을 채우는 방법

  24. 24

    BeautifulSoup으로 테이블 헤더를 스크래핑하는 동안 ".text"를 사용하여 원하지 않는 HTML을 제거 할 수없는 이유

  25. 25

    Ruby와 Nokogiri 구문 분석 테이블?

  26. 26

    R로 소스 HTML이 아닌 실제 페이지 스크래핑 화면

  27. 27

    BeautifulSoup을 사용하여 HTML 테이블에서 하나의 열 스크래핑

  28. 28

    R의 웹 스크래핑 : HTML 테이블 구문 분석 문제

  29. 29

    HTML 테이블 스크래핑 – 열에서 href 속성 가져 오기

뜨겁다태그

보관