JSOUP「<br/>」を選択

user3797088

こんにちはみんな私はHTMLファイルでタグ「<br/>」を選択しようとしていますが、ここでは機能していません。サイトのソースです。

</div><p><a href="http://www.pinoyfitness.com/wp-content/uploads/2014/03/sofitel-manila-half-marathon-2014-poster.jpg"><img src="http://www.pinoyfitness.com/wp-content/uploads/2014/03/sofitel-manila-half-marathon-2014-poster-540x783.jpg" alt="sofitel-manila-half-marathon-2014-poster" width="540" height="783" class="aligncenter size-medium wp-image-32747" /></a></p>
<p>Introducing the Manila Half Marathon happening on August 17, 2014 at the SM Mall of Asia Grounds. This race is for the benefit of the children of <a href="http://www.virlanie.org/" rel="nofollow" target="_blank">Virlanie</a></p>
 <p><font size="3"><strong>Sofitel Manila Half-Marathon 2014</strong></font><br />
August 17, 2014 @ 3AM<br />
SM Mall of Asia<br />
5K/10K/21K<br />
Organizer: RunRio</p>
<p><strong>Registration Fees:</strong><br />
21K &#8211; P950<br />
10K &#8211; P850<br />
5K &#8211; P750</p>

これが私のこれまでの仕事です:

doc = Jsoup.connect("http://www.pinoyfitness.com/2014/03/manila-half-marathon-august-17-2014/").timeout(0).get();
            Element bod = doc.body();
            Elements info = bod.select("br");
            String textString = info.text();

            System.out.println(textString);

簡単に分割してフォーマットできるように、「<br/>」を使用してhtmlコードを取得しようとしています。

しかし、要素「P」を選択すると、「<br/>」を含まないすべてのテキストが次のように印刷されます。「2014年8月17日にSMモールオブアジアグラウンドで開催されるマニラハーフマラソンの紹介。このレースはVirlanieSofitelマニラハーフマラソン2014の子供たちの利益2014年8月17日@ 3AMSMモールオブアジア5K / 10K / 21Kオーガナイザー」

私はJSOUPを初めて使用するので、newbeeエラーなどが発生した場合は、気楽に行ってください。前もって感謝します。

Mints97

<br/>解析されたコンテンツのタグを保持したい場合、問題のやや単純な解決策<br/>は、元のHTMLコードのすべてのタグをテキストプレースホルダーに置き換えることです(ここからそれを行うための便利な正規表現):

html.replaceAll("(?i)<br[^>]*>", "br2n")

次にtextString.split("br2n")、これがあなたが達成しようとしてきたことであるならば、あなたはすることができます

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

HTML <br>タグ内のテキストを抽出するJSOUP

分類Dev

JsoupでHTMLタグを選択する

分類Dev

JSoupで「名前」で選択

分類Dev

<br/>タグの後にデータを選択するXpath

分類Dev

XPathは最初まですべてを選択します<br/>

分類Dev

Jsoupを使用してクラスとIDを選択する

分類Dev

Jsoupタグの後のテキストを選択

分類Dev

JSOUP特定のIDの<div>を選択します

分類Dev

JSoup-リンク内にない画像を選択

分類Dev

JSOUPで特定のHTMLテーブルを選択します

分類Dev

要素Jsoupの最も内側の子を選択する

分類Dev

Android-Jsoupは特定のリンクを選択します

分類Dev

jsoupのdivからクラスを選択する方法は?

分類Dev

子クラス要素を選択しない(Jsoup)

分類Dev

jsoupの各html要素を選択します

分類Dev

Jsoup-選択した要素の解析

分類Dev

JSoup、要素を削除

分類Dev

Jsoupを使用して、クラスのないHTML要素を選択します

分類Dev

jsoupを使用してdivで2から1スパンを選択する方法

分類Dev

JavaでJsoupを使用してdivクラスタグを選択します

分類Dev

Jsoupはhtmlタグを含むテキストWITHを選択します

分類Dev

Jsoupを使用して子ノードからのみ選択しますか?

分類Dev

Jsoupはすべての要素を選択して反復します

分類Dev

Jsoupは一重引用符を含む属性で選択します(Scala)

分類Dev

深さで要素を選択するJsoup(親からのDOMレベル)

分類Dev

JSoup Webスクレイピング:各値を選択する方法

分類Dev

jsoupの解析、属性のないHTMLの選択

分類Dev

純粋なCSSによってペアの<br>要素の1つを選択する

分類Dev

JQuery UIオートコンプリートは、選択後に<br>を挿入します

Related 関連記事

  1. 1

    HTML <br>タグ内のテキストを抽出するJSOUP

  2. 2

    JsoupでHTMLタグを選択する

  3. 3

    JSoupで「名前」で選択

  4. 4

    <br/>タグの後にデータを選択するXpath

  5. 5

    XPathは最初まですべてを選択します<br/>

  6. 6

    Jsoupを使用してクラスとIDを選択する

  7. 7

    Jsoupタグの後のテキストを選択

  8. 8

    JSOUP特定のIDの<div>を選択します

  9. 9

    JSoup-リンク内にない画像を選択

  10. 10

    JSOUPで特定のHTMLテーブルを選択します

  11. 11

    要素Jsoupの最も内側の子を選択する

  12. 12

    Android-Jsoupは特定のリンクを選択します

  13. 13

    jsoupのdivからクラスを選択する方法は?

  14. 14

    子クラス要素を選択しない(Jsoup)

  15. 15

    jsoupの各html要素を選択します

  16. 16

    Jsoup-選択した要素の解析

  17. 17

    JSoup、要素を削除

  18. 18

    Jsoupを使用して、クラスのないHTML要素を選択します

  19. 19

    jsoupを使用してdivで2から1スパンを選択する方法

  20. 20

    JavaでJsoupを使用してdivクラスタグを選択します

  21. 21

    Jsoupはhtmlタグを含むテキストWITHを選択します

  22. 22

    Jsoupを使用して子ノードからのみ選択しますか?

  23. 23

    Jsoupはすべての要素を選択して反復します

  24. 24

    Jsoupは一重引用符を含む属性で選択します(Scala)

  25. 25

    深さで要素を選択するJsoup(親からのDOMレベル)

  26. 26

    JSoup Webスクレイピング:各値を選択する方法

  27. 27

    jsoupの解析、属性のないHTMLの選択

  28. 28

    純粋なCSSによってペアの<br>要素の1つを選択する

  29. 29

    JQuery UIオートコンプリートは、選択後に<br>を挿入します

ホットタグ

アーカイブ