[JAVA] 웹 페이지에서 html 링크 가져 오기

debugcn 에 게시 Dev

Aimkiller

Java를 사용 하여이 그림의 링크를 얻고 싶습니다. 이미지는 아래에 있습니다. 해당 웹 페이지에는 링크가 거의 없습니다. 이 코드를 stackoverflow에서 찾았지만 사용 방법을 이해하지 못합니다.

 import org.jsoup.Jsoup;
 import org.jsoup.nodes.Document;
 import org.jsoup.nodes.Element;
 import org.jsoup.select.Elements;

 public class weber{
    public static void main(String[] args)throws Exception{
        String url = "http://www.skyovnis.com/category/ufology/";
        Document doc = Jsoup.connect(url).get();

        /*String question = doc.select("#site-inner").text();
        System.out.println("Question: " + question);*/

        Elements anser = doc.select("#container .entry-title a");
        for (Element anse : anser){
            System.out.println("Answer: " + anse.text());
        }
    }
}

코드는 내가 찾은 원본에서 편집되었습니다. 도와주세요.

Sanka

URL의 경우 다음 코드가 제대로 작동합니다.

public static void main(String[] args) {

    Document doc;
    try {

        // need http protocol
        doc = Jsoup.connect("http://www.skyovnis.com/category/ufology/").userAgent("Mozilla").get();
        // get page title
        String title = doc.title();
        System.out.println("title : " + title);

        // get all links (this is what you want)
        Elements links = doc.select("a[href]");
        for (Element link : links) {

            // get the value from href attribute
            System.out.println("\nlink : " + link.attr("href"));
            System.out.println("text : " + link.text());

        }

    } catch (IOException e) {
        e.printStackTrace();
    }

  }

출력은

title : Ufology

link : http://www.shop.skyovnis.com/
text : Shop

link : http://www.shop.skyovnis.com/product-category/books/
text : Books

다음 코드는 텍스트별로 링크를 필터링합니다.

        for (Element link : links) {



            if(link.text().contains("Arecibo Message"))//find the link with some texts
            {
                System.out.println("here is the element you need");
                System.out.println("\nlink : " + link.attr("href"));
                System.out.println("text : " + link.text());
            }


        }

HTTP 403 오류 메시지를 피하기 위해 Jsoup에서 "userAgent"를 지정하는 것이 좋습니다.

문서 문서 = Jsoup.connect ( " http://anyurl.com ") .userAgent ( "Mozilla"). get ();

"온나 말리 마법사 유투 카마 칼라."

참조 :

https://www.mkyong.com/java/jsoup-html-parser-hello-world-examples/

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-13

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

[JAVA] 웹 페이지에서 html 링크 가져 오기

[JAVA] 웹 페이지에서 html 링크 가져 오기

웹 페이지에서 링크 가져 오기

웹 페이지에서 링크 가져 오기

웹 페이지 -Excel VBA에서 링크 / URL 가져 오기

BeautifulSoup으로 웹 페이지에서 링크 가져 오기 및 스크롤링

Python 및 셀레늄-웹 페이지에서 모든 링크 가져 오기

Android에서 웹 페이지 크기 (바이트) 가져 오기

Matlab에서 웹 페이지 html 및 css 코드 가져 오기

웹 페이지에서 모든 링크를 가져 오지 못함

dom html, 링크에서 링크 오디오 가져 오기

Clojure가 웹 사이트에서 페이지를 HTML로 가져 오기

웹 사이트에 로그인하고 페이지에서 HTML 가져 오기

다른 컴퓨터의 다른 웹 페이지에서 HTML 가져 오기

Java의 외부 웹 페이지에서 콘텐츠 가져 오기

Python으로 웹 사이트에서 오디오 소스 링크 가져 오기

웹 사이트 HTML 페이지 링크로 인해 404 오류가 발생 함

자바로 웹 사이트 링크 가져 오기

테이블의 모든 항목에 대한 웹 링크 가져 오기 및 페이지 매김

Java로 동적 HTML 페이지에서 데이터 가져 오기

Fluid-링크에서 페이지 제목 가져 오기

HTML 웹 페이지에서 특정 데이터를 가져 오는 방법

WWW :: Mechanize 및 Perl을 사용하여 웹 페이지에서 링크를 가져 오는 방법

Java에서 웹 스크래핑을 통해 여러 HTML 테이블의 데이터를 가져 오는 방법

Excel VBA-웹 스크랩 핑-HTML 표 셀에서 값 가져 오기

웹 페이지에서 테이블 가져 오기

PHP의 웹 페이지에서 데이터 가져 오기

웹 페이지에서 이상한 문자 가져 오기

Flutter : 웹 사이트에서 "원시"html 문서 가져 오기

스크립트 (seajs)로 작성된 웹 페이지에서 Excel로 데이터 가져 오기

Java에서 API HtmlUnit을 사용하여 로그인 및 웹 페이지 가져 오기