[JAVA] 웹 페이지에서 html 링크 가져 오기

Aimkiller

Java를 사용 하여이 그림의 링크를 얻고 싶습니다. 이미지는 아래에 있습니다. 해당 웹 페이지에는 링크가 거의 없습니다. 이 코드를 stackoverflow에서 찾았지만 사용 방법을 이해하지 못합니다.

 import org.jsoup.Jsoup;
 import org.jsoup.nodes.Document;
 import org.jsoup.nodes.Element;
 import org.jsoup.select.Elements;

 public class weber{
    public static void main(String[] args)throws Exception{
        String url = "http://www.skyovnis.com/category/ufology/";
        Document doc = Jsoup.connect(url).get();

        /*String question = doc.select("#site-inner").text();
        System.out.println("Question: " + question);*/

        Elements anser = doc.select("#container .entry-title a");
        for (Element anse : anser){
            System.out.println("Answer: " + anse.text());
        }
    }
}

코드는 내가 찾은 원본에서 편집되었습니다. 도와주세요.

영상

Sanka

URL의 경우 다음 코드가 제대로 작동합니다.

public static void main(String[] args) {

    Document doc;
    try {

        // need http protocol
        doc = Jsoup.connect("http://www.skyovnis.com/category/ufology/").userAgent("Mozilla").get();
        // get page title
        String title = doc.title();
        System.out.println("title : " + title);

        // get all links (this is what you want)
        Elements links = doc.select("a[href]");
        for (Element link : links) {

            // get the value from href attribute
            System.out.println("\nlink : " + link.attr("href"));
            System.out.println("text : " + link.text());

        }

    } catch (IOException e) {
        e.printStackTrace();
    }

  }

출력은

title : Ufology

link : http://www.shop.skyovnis.com/
text : Shop

link : http://www.shop.skyovnis.com/product-category/books/
text : Books

다음 코드는 텍스트별로 링크를 필터링합니다.

        for (Element link : links) {



            if(link.text().contains("Arecibo Message"))//find the link with some texts
            {
                System.out.println("here is the element you need");
                System.out.println("\nlink : " + link.attr("href"));
                System.out.println("text : " + link.text());
            }


        }

HTTP 403 오류 메시지를 피하기 위해 Jsoup에서 "userAgent"를 지정하는 것이 좋습니다.

문서 문서 = Jsoup.connect ( " http://anyurl.com ") .userAgent ( "Mozilla"). get ();

"온나 말리 마법사 유투 카마 칼라."

참조 :

https://www.mkyong.com/java/jsoup-html-parser-hello-world-examples/

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

웹 페이지에서 링크 가져 오기

분류에서Dev

웹 페이지에서 링크 가져 오기

분류에서Dev

웹 페이지 -Excel VBA에서 링크 / URL 가져 오기

분류에서Dev

BeautifulSoup으로 웹 페이지에서 링크 가져 오기 및 스크롤링

분류에서Dev

Python 및 셀레늄-웹 페이지에서 모든 링크 가져 오기

분류에서Dev

Android에서 웹 페이지 크기 (바이트) 가져 오기

분류에서Dev

Matlab에서 웹 페이지 html 및 css 코드 가져 오기

분류에서Dev

웹 페이지에서 모든 링크를 가져 오지 못함

분류에서Dev

dom html, 링크에서 링크 오디오 가져 오기

분류에서Dev

Clojure가 웹 사이트에서 페이지를 HTML로 가져 오기

분류에서Dev

웹 사이트에 로그인하고 페이지에서 HTML 가져 오기

분류에서Dev

다른 컴퓨터의 다른 웹 페이지에서 HTML 가져 오기

분류에서Dev

Java의 외부 웹 페이지에서 콘텐츠 가져 오기

분류에서Dev

Python으로 웹 사이트에서 오디오 소스 링크 가져 오기

분류에서Dev

웹 사이트 HTML 페이지 링크로 인해 404 오류가 발생 함

분류에서Dev

자바로 웹 사이트 링크 가져 오기

분류에서Dev

테이블의 모든 항목에 대한 웹 링크 가져 오기 및 페이지 매김

분류에서Dev

Java로 동적 HTML 페이지에서 데이터 가져 오기

분류에서Dev

Fluid-링크에서 페이지 제목 가져 오기

분류에서Dev

HTML 웹 페이지에서 특정 데이터를 가져 오는 방법

분류에서Dev

WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

분류에서Dev

Java에서 웹 스크래핑을 통해 여러 HTML 테이블의 데이터를 가져 오는 방법

분류에서Dev

Excel VBA-웹 스크랩 핑-HTML 표 셀에서 값 가져 오기

분류에서Dev

웹 페이지에서 테이블 가져 오기

분류에서Dev

PHP의 웹 페이지에서 데이터 가져 오기

분류에서Dev

웹 페이지에서 이상한 문자 가져 오기

분류에서Dev

Flutter : 웹 사이트에서 "원시"html 문서 가져 오기

분류에서Dev

스크립트 (seajs)로 작성된 웹 페이지에서 Excel로 데이터 가져 오기

분류에서Dev

Java에서 API HtmlUnit을 사용하여 로그인 및 웹 페이지 가져 오기

Related 관련 기사

  1. 1

    웹 페이지에서 링크 가져 오기

  2. 2

    웹 페이지에서 링크 가져 오기

  3. 3

    웹 페이지 -Excel VBA에서 링크 / URL 가져 오기

  4. 4

    BeautifulSoup으로 웹 페이지에서 링크 가져 오기 및 스크롤링

  5. 5

    Python 및 셀레늄-웹 페이지에서 모든 링크 가져 오기

  6. 6

    Android에서 웹 페이지 크기 (바이트) 가져 오기

  7. 7

    Matlab에서 웹 페이지 html 및 css 코드 가져 오기

  8. 8

    웹 페이지에서 모든 링크를 가져 오지 못함

  9. 9

    dom html, 링크에서 링크 오디오 가져 오기

  10. 10

    Clojure가 웹 사이트에서 페이지를 HTML로 가져 오기

  11. 11

    웹 사이트에 로그인하고 페이지에서 HTML 가져 오기

  12. 12

    다른 컴퓨터의 다른 웹 페이지에서 HTML 가져 오기

  13. 13

    Java의 외부 웹 페이지에서 콘텐츠 가져 오기

  14. 14

    Python으로 웹 사이트에서 오디오 소스 링크 가져 오기

  15. 15

    웹 사이트 HTML 페이지 링크로 인해 404 오류가 발생 함

  16. 16

    자바로 웹 사이트 링크 가져 오기

  17. 17

    테이블의 모든 항목에 대한 웹 링크 가져 오기 및 페이지 매김

  18. 18

    Java로 동적 HTML 페이지에서 데이터 가져 오기

  19. 19

    Fluid-링크에서 페이지 제목 가져 오기

  20. 20

    HTML 웹 페이지에서 특정 데이터를 가져 오는 방법

  21. 21

    WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

  22. 22

    Java에서 웹 스크래핑을 통해 여러 HTML 테이블의 데이터를 가져 오는 방법

  23. 23

    Excel VBA-웹 스크랩 핑-HTML 표 셀에서 값 가져 오기

  24. 24

    웹 페이지에서 테이블 가져 오기

  25. 25

    PHP의 웹 페이지에서 데이터 가져 오기

  26. 26

    웹 페이지에서 이상한 문자 가져 오기

  27. 27

    Flutter : 웹 사이트에서 "원시"html 문서 가져 오기

  28. 28

    스크립트 (seajs)로 작성된 웹 페이지에서 Excel로 데이터 가져 오기

  29. 29

    Java에서 API HtmlUnit을 사용하여 로그인 및 웹 페이지 가져 오기

뜨겁다태그

보관