哑巴先生
我正在尝试使用JSOUP解析此URL。我得到的解析doc的像Unicode格式而不是实际的数据,而我解析这个网址给我的期望正确的印地文文本。我正在使用下面的代码来解析URl。BTW网址托管在我的网站上。服务器上的文本文件是否有问题?我无法弄清楚这一点。
Document doc = Jsoup
.connect(
"hindi-stories.kratav.com/content/social_aalha.html")
.userAgent("Mozilla").timeout(15 * 1000).get();
盖·布瓦莱特(Guy Bouallet)
我检查了第一个URL的源代码,没有指定编码。而第二个有一个meta:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
尝试使用指定字符集的方法来解析第一个URL,即:
Document document = Jsoup.parse(new URL(url).openStream(), "UTF-16", url);
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
编辑于
我来说两句