노드를 사용하여 HTML 태그 외부에있는 특정 텍스트를 가져 오는 JSOUP

켈라 로스

그래서 저는 jSoup을 사용하여 일부 메타 데이터에 대한 웹 사이트를 구문 분석했습니다. 문제는 내가 필요로하는 중요한 메타 데이터 중 일부가 태그 내에 있지 않고 가져 오는 방법을 모른다는 것입니다.

다음은 내 URL에서 가져와야하는 데이터의 예입니다.

<div class="newclass ">
        <div>
            <p>     
                    <strong>Arist:</strong>&nbsp;Picasso Biggie <em>|</em>
                    <strong>Released:</strong>&nbsp;3 years ago <em>|</em>
                    <strong>Album:</strong>&nbsp;Picasso Biggie: The Big OneUp <em>|</em>                       
                    <strong>Producer:</strong>&nbsp;Various <em>|</em>                      
                    <strong>Featuring:</strong>&nbsp;Mount Kimbie <em>|</em>                                        
            </p>
        </div>
</div>

여기 html에서 찾고있는 것은 아티스트 "Picasso Biggie", "3 년 전"발매 연도, 앨범 "Picasso Biggie : The Big OneUp"등과 같은 것입니다. jSoup과 함께 노드를 사용하는 것이 좋지만 몇 가지 예만 찾을 수 있으며 특히 찾고있는 작업을 수행하도록 jSoup를 얻는 방법을 알 수 없습니다.

이것은 내가 시도한 코드이며 아무것도 반환하지 않습니다.

Document doc = Jsoup.connect(URL).get;
Elements dakss1 = doc.select(".newclass ");
for(Element dakss : rayz1) { 
     TextNode quill = (TextNode) rayz1.nextSibling().childNode(0);
     System.out.println("" + quill);
}

업데이트 : Shaowei Ling 의 답변 은 태그 외부의 모든 텍스트를 가져 오는 데 적합하지만 특정 노드 만 지정하는 방법이 있는지 궁금합니다. 그래서 특정 단어 만 얻을 수 있습니다. 예를 들어 얻는 대신

    Picasso Biggie
    3 years ago
    Picasso Biggie: The Big OneUp
    Various
    Mount Kimbie

나는 단지 얻는다 :

3 years ago

앨범이 발매 된 해만 있으면 되나요?

업데이트 # 2 : 좋아, 위와 동일한 HTML 구조로 여러 항목을 구문 분석하는 두 번째 문제를 해결하기 위해 jSoup에 대한 선택기 쿼리에 원하는 특정 요소를 포함했습니다. 예를 들어 내가 Picasso Biggies 앨범의 모든 출시 날짜를 알고 싶다면. 이것은 내가 사용한 코드입니다.

    Document doc = Jsoup.connect(URL).get;
    Elements dakss1 = doc.select(".newclass p strong:contains(Released) ");
    for(Element dakss : dakss1) { 
         Node nodeWithReleaseDates =(Node) dakss.nextSibling();;
         System.out.println("" + nodeWithReleaseDates);
    }

이것은 계속해서 다음과 같이 Picasso Biggie의 다양한 앨범에 대해 내가 원하는 모든 릴리스 날짜를 반환했습니다.

3 years ago
2 years ago 
7 months ago
1 month ago
샤오 웨이 링

귀하의 질문에는 정의되지 않은 변수가 rayz1있습니다.

예제 코드가 도움이 될 수 있습니다. 나는 그것을 실행했다, 그것은 작동한다.

    String html = 
            "<div class=\"newclass \">\n"
            + "        <div>\n"
            + "            <p>     \n"
            + "                    <strong>Arist:</strong>&nbsp;Picasso Biggie <em>|</em>\n"
            + "                    <strong>Released:</strong>&nbsp;3 years ago <em>|</em>\n"
            + "                    <strong>Album:</strong>&nbsp;Picasso Biggie: The Big OneUp <em>|</em>                       \n"
            + "                    <strong>Producer:</strong>&nbsp;Various <em>|</em>                      \n"
            + "                    <strong>Featuring:</strong>&nbsp;Mount Kimbie <em>|</em>                                        \n"
            + "            </p>\n"
            + "        </div>\n"
            + "</div>";
    Document doc = Jsoup.parse(html);
    Elements dakss1 = doc.select("div p strong");
    for (Node dakss : dakss1) {
        System.out.println(dakss.nextSibling().toString().replace("&nbsp;", "").trim());
    }

결과는 다음과 같습니다.

    Picasso Biggie 
    3 년 전 
    Picasso Biggie : The Big OneUp 
    Various 
    Mount Kimbie

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

JSoup를 사용하여 HTML 태그에서 적절한 텍스트를 가져 오기

분류에서Dev

QRegExp-두 HTML 태그 사이에 특정 텍스트를 가져 오는 방법

분류에서Dev

뷰티플 수프를 사용하여 유사 태그가 여러 개있는 경우 특정 HTML 태그에서 텍스트 추출

분류에서Dev

Javascript를 사용하여 HTML 페이지의 <SCRIPT> 태그에서 특정 데이터를 가져 오는 방법

분류에서Dev

Python에서 태그 이름을 사용하여 특정 태그 내부에 텍스트를 가져 오는 방법

분류에서Dev

jsoup을 사용하여 전체 HTML 페이지에서 특정 태그를 제거하는 방법

분류에서Dev

Java를 사용하여 XML 태그의 특정 하위 노드 가져 오기

분류에서Dev

jsoup을 사용하여 html 태그 외부에서 텍스트를 추출하는 방법은 무엇입니까?

분류에서Dev

JavaScript를 사용하여 페이지에서 특정 클래스로 동적으로로드 된 HTML 태그를 가져 오는 방법은 무엇입니까?

분류에서Dev

BeautifulSoup을 사용하여 HTML 태그 뒤에있는 텍스트 가져 오기

분류에서Dev

C # HTML 코드의 범위 태그에서 텍스트를 대체하는 텍스트 가져 오기

분류에서Dev

wget을 사용하여 웹 페이지의 특정 태그 사이에서 텍스트를 가져 오는 방법은 무엇입니까?

분류에서Dev

특정 태그 사이가 아닌 HTML 태그 외부의 텍스트를 일치시키는 정규 표현식

분류에서Dev

RegEx를 사용하여 사용자 정의 태그간에 텍스트 가져 오기

분류에서Dev

DOMXPath를 사용하여 특정 텍스트 노드의 값 가져 오기

분류에서Dev

jSoup을 사용하여 <pre> 필드에서 텍스트를 가져오고 서식을 유지하는 방법

분류에서Dev

HTML 입력 태그를 사용하여 텍스트 영역의 텍스트 색상을 설정하는 방법

분류에서Dev

특정 태그 reg 표현식으로 JavaScript를 사용하여 HTML 문서에서 요소를 가져 오는 방법은 무엇입니까?

분류에서Dev

Selenium을 사용하여 깊이 div 태그 내부에 텍스트를 가져 오는 방법

분류에서Dev

WebRequest를 사용하여 VB.net의 웹 페이지에서 특정 태그 값을 가져 오는 방법

분류에서Dev

Jsoup을 사용하여 총 Html 태그를 계산하는 방법

분류에서Dev

내부에 특정 태그가있는 경우 java를 사용하여 sgml에서 상위 태그를 제거하십시오.

분류에서Dev

특정 줄 사이에 텍스트를 가져 오는 방법

분류에서Dev

HTML span 태그 내부의 모든 텍스트를 가져오고 자바 스크립트를 사용하여 클러스터링

분류에서Dev

HTML 태그로 텍스트를 래핑하지만 특정 HTML 태그 내의 텍스트를 제외하는 방법

분류에서Dev

Bash를 사용하여 텍스트에서 특정 문자열 가져 오기

분류에서Dev

sed를 사용하여 XML 파일에서 특정 텍스트 가져 오기

분류에서Dev

javascript를 사용하여 html 태그 끝에 텍스트를 추가하는 방법

분류에서Dev

쉘 스크립트를 사용하여 html 파일에서 특정 값을 가져 오는 방법

Related 관련 기사

  1. 1

    JSoup를 사용하여 HTML 태그에서 적절한 텍스트를 가져 오기

  2. 2

    QRegExp-두 HTML 태그 사이에 특정 텍스트를 가져 오는 방법

  3. 3

    뷰티플 수프를 사용하여 유사 태그가 여러 개있는 경우 특정 HTML 태그에서 텍스트 추출

  4. 4

    Javascript를 사용하여 HTML 페이지의 <SCRIPT> 태그에서 특정 데이터를 가져 오는 방법

  5. 5

    Python에서 태그 이름을 사용하여 특정 태그 내부에 텍스트를 가져 오는 방법

  6. 6

    jsoup을 사용하여 전체 HTML 페이지에서 특정 태그를 제거하는 방법

  7. 7

    Java를 사용하여 XML 태그의 특정 하위 노드 가져 오기

  8. 8

    jsoup을 사용하여 html 태그 외부에서 텍스트를 추출하는 방법은 무엇입니까?

  9. 9

    JavaScript를 사용하여 페이지에서 특정 클래스로 동적으로로드 된 HTML 태그를 가져 오는 방법은 무엇입니까?

  10. 10

    BeautifulSoup을 사용하여 HTML 태그 뒤에있는 텍스트 가져 오기

  11. 11

    C # HTML 코드의 범위 태그에서 텍스트를 대체하는 텍스트 가져 오기

  12. 12

    wget을 사용하여 웹 페이지의 특정 태그 사이에서 텍스트를 가져 오는 방법은 무엇입니까?

  13. 13

    특정 태그 사이가 아닌 HTML 태그 외부의 텍스트를 일치시키는 정규 표현식

  14. 14

    RegEx를 사용하여 사용자 정의 태그간에 텍스트 가져 오기

  15. 15

    DOMXPath를 사용하여 특정 텍스트 노드의 값 가져 오기

  16. 16

    jSoup을 사용하여 <pre> 필드에서 텍스트를 가져오고 서식을 유지하는 방법

  17. 17

    HTML 입력 태그를 사용하여 텍스트 영역의 텍스트 색상을 설정하는 방법

  18. 18

    특정 태그 reg 표현식으로 JavaScript를 사용하여 HTML 문서에서 요소를 가져 오는 방법은 무엇입니까?

  19. 19

    Selenium을 사용하여 깊이 div 태그 내부에 텍스트를 가져 오는 방법

  20. 20

    WebRequest를 사용하여 VB.net의 웹 페이지에서 특정 태그 값을 가져 오는 방법

  21. 21

    Jsoup을 사용하여 총 Html 태그를 계산하는 방법

  22. 22

    내부에 특정 태그가있는 경우 java를 사용하여 sgml에서 상위 태그를 제거하십시오.

  23. 23

    특정 줄 사이에 텍스트를 가져 오는 방법

  24. 24

    HTML span 태그 내부의 모든 텍스트를 가져오고 자바 스크립트를 사용하여 클러스터링

  25. 25

    HTML 태그로 텍스트를 래핑하지만 특정 HTML 태그 내의 텍스트를 제외하는 방법

  26. 26

    Bash를 사용하여 텍스트에서 특정 문자열 가져 오기

  27. 27

    sed를 사용하여 XML 파일에서 특정 텍스트 가져 오기

  28. 28

    javascript를 사용하여 html 태그 끝에 텍스트를 추가하는 방법

  29. 29

    쉘 스크립트를 사용하여 html 파일에서 특정 값을 가져 오는 방법

뜨겁다태그

보관