次の簡略化された例を見てください。
public static void main(String[] args) {
String html = "<html>\n" +
" <head></head>\n" +
" <body>\n" +
" <div> \n" +
" <p> 2 <= X </p> \n" +
" </div>\n" +
" </body>\n" +
"</html>";
Document doc = Jsoup.parse(html);
System.out.println(doc.select("p").outerHtml());
}
これは印刷されます<p> 2 <= X </p>
が、選択したhtml部分がそのまま印刷されることを期待しています:<p> 2 <= X </p>
。'<'記号を変換しないようにjsoupに指示するにはどうすればよいですか?
jsoupを使用することが可能です。
jSoup 1.8.3では、元のhtmlを保持するParser.unescapeEntitiesメソッドを使用できます。
import org.jsoup.parser.Parser;
...
String html = Parser.unescapeEntities(original_html, false));
以前のリリースでは、このメソッドは存在しません。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加