웹 페이지에서 링크 가져 오기

user2755149

이 웹 페이지의 모든 항목 링크 (URL)를 나누기로 구분 된 텍스트 파일로 가져와야합니다 (즉, "항목 # 1" "항목 # 2"등의 목록).

http://dota-trade.com/equipment?order=name 은 웹 페이지이며 아래로 스크롤하면 약 500-1000 개의 항목이 계속됩니다.

어떤 프로그래밍 언어를 사용해야하며 어떻게해야할까요? 이미 imacros를 사용한 경험이 있습니다.

Jakub

HtmlAgilityPack을 다운로드해야합니다.

using HtmlAgilityPack;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Net;
using System.Text;
using System.Threading.Tasks;

namespace ConsoleApplication5
{
    class Program
    {
        static void Main(string[] args)
        {
            WebClient wc = new WebClient();
            var sourceCode = wc.DownloadString("http://dota-trade.com/equipment?order=name");
            HtmlDocument doc = new HtmlDocument();
            doc.LoadHtml(sourceCode);
            var node = doc.DocumentNode;
            var nodes = node.SelectNodes("//a");
            List<string> links = new List<string>();
            foreach (var item in nodes)
            {
                var link = item.Attributes["href"].Value;
                links.Add(link.Contains("http") ? link : "http://dota-trade.com" +link);
            }
            int index = 1;
            while (true)
            {
                sourceCode = wc.DownloadString("http://dota-trade.com/equipment?order=name&offset=" + index.ToString());
                doc = new HtmlDocument();
                doc.LoadHtml(sourceCode);
                node = doc.DocumentNode;
                nodes = node.SelectNodes("//a");
                var cont = node.SelectSingleNode("//tr[@itemtype='http://schema.org/Thing']");
                if (cont == null) break; 
                foreach (var item in nodes)
                {
                    var link = item.Attributes["href"].Value;
                    links.Add(link.Contains("http") ? link : "http://dota-trade.com" + link);
                }
                index++;
            }
            System.IO.File.WriteAllLines(@"C:\Users\Public\WriteLines.txt", links);
        }
    }
}

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

웹 페이지에서 링크 가져 오기

분류에서Dev

웹 페이지 -Excel VBA에서 링크 / URL 가져 오기

분류에서Dev

[JAVA] 웹 페이지에서 html 링크 가져 오기

분류에서Dev

BeautifulSoup으로 웹 페이지에서 링크 가져 오기 및 스크롤링

분류에서Dev

Python 및 셀레늄-웹 페이지에서 모든 링크 가져 오기

분류에서Dev

Android에서 웹 페이지 크기 (바이트) 가져 오기

분류에서Dev

웹 페이지에서 모든 링크를 가져 오지 못함

분류에서Dev

Python으로 웹 사이트에서 오디오 소스 링크 가져 오기

분류에서Dev

자바로 웹 사이트 링크 가져 오기

분류에서Dev

테이블의 모든 항목에 대한 웹 링크 가져 오기 및 페이지 매김

분류에서Dev

Fluid-링크에서 페이지 제목 가져 오기

분류에서Dev

WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

분류에서Dev

웹 페이지에서 테이블 가져 오기

분류에서Dev

PHP의 웹 페이지에서 데이터 가져 오기

분류에서Dev

웹 페이지에서 이상한 문자 가져 오기

분류에서Dev

스크립트 (seajs)로 작성된 웹 페이지에서 Excel로 데이터 가져 오기

분류에서Dev

웹 페이지에서 모든 HTTP URL 가져 오기

분류에서Dev

웹 페이지에서 내일 날짜 가져 오기

분류에서Dev

Matlab에서 웹 페이지 html 및 css 코드 가져 오기

분류에서Dev

Android의 웹 페이지에서 문자열 가져 오기

분류에서Dev

Facebook은 웹 스크랩에서 Plesk 기본 페이지를 가져옵니다.

분류에서Dev

wget 및 Perl 스크립트를 사용하여 웹 페이지에서 정보 가져 오기

분류에서Dev

동일한 네트워크에서 웹 페이지의 소스 코드 가져 오기

분류에서Dev

Selenium을 사용하여 스크래핑하여 웹 페이지에서 위치 정보 가져 오기

분류에서Dev

vedio 이름과 함께 웹 페이지에 삽입 된 vedio 링크 이름을 가져 오는 방법

분류에서Dev

Django 템플릿에서 페이지 URL 가져 오기 및 링크 단축

분류에서Dev

웹 사이트의 sitemap.xml에서 특정 .xml에 대한 링크 가져 오기

분류에서Dev

ReactJS 가져 오기가 빈 웹 페이지에서 작동하지 않음

분류에서Dev

dom html, 링크에서 링크 오디오 가져 오기

Related 관련 기사

  1. 1

    웹 페이지에서 링크 가져 오기

  2. 2

    웹 페이지 -Excel VBA에서 링크 / URL 가져 오기

  3. 3

    [JAVA] 웹 페이지에서 html 링크 가져 오기

  4. 4

    BeautifulSoup으로 웹 페이지에서 링크 가져 오기 및 스크롤링

  5. 5

    Python 및 셀레늄-웹 페이지에서 모든 링크 가져 오기

  6. 6

    Android에서 웹 페이지 크기 (바이트) 가져 오기

  7. 7

    웹 페이지에서 모든 링크를 가져 오지 못함

  8. 8

    Python으로 웹 사이트에서 오디오 소스 링크 가져 오기

  9. 9

    자바로 웹 사이트 링크 가져 오기

  10. 10

    테이블의 모든 항목에 대한 웹 링크 가져 오기 및 페이지 매김

  11. 11

    Fluid-링크에서 페이지 제목 가져 오기

  12. 12

    WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

  13. 13

    웹 페이지에서 테이블 가져 오기

  14. 14

    PHP의 웹 페이지에서 데이터 가져 오기

  15. 15

    웹 페이지에서 이상한 문자 가져 오기

  16. 16

    스크립트 (seajs)로 작성된 웹 페이지에서 Excel로 데이터 가져 오기

  17. 17

    웹 페이지에서 모든 HTTP URL 가져 오기

  18. 18

    웹 페이지에서 내일 날짜 가져 오기

  19. 19

    Matlab에서 웹 페이지 html 및 css 코드 가져 오기

  20. 20

    Android의 웹 페이지에서 문자열 가져 오기

  21. 21

    Facebook은 웹 스크랩에서 Plesk 기본 페이지를 가져옵니다.

  22. 22

    wget 및 Perl 스크립트를 사용하여 웹 페이지에서 정보 가져 오기

  23. 23

    동일한 네트워크에서 웹 페이지의 소스 코드 가져 오기

  24. 24

    Selenium을 사용하여 스크래핑하여 웹 페이지에서 위치 정보 가져 오기

  25. 25

    vedio 이름과 함께 웹 페이지에 삽입 된 vedio 링크 이름을 가져 오는 방법

  26. 26

    Django 템플릿에서 페이지 URL 가져 오기 및 링크 단축

  27. 27

    웹 사이트의 sitemap.xml에서 특정 .xml에 대한 링크 가져 오기

  28. 28

    ReactJS 가져 오기가 빈 웹 페이지에서 작동하지 않음

  29. 29

    dom html, 링크에서 링크 오디오 가져 오기

뜨겁다태그

보관