웹 페이지에서 일부 텍스트를 구문 분석하는 프로그램을 Java로 작성 중입니다. 그러나 아래 코드를 사용하면 이상하거나 잘못된 문자가 표시됩니다.
암호:
URL url = new URL(getSearchUrl(crit));
URLConnection connection = url.openConnection();
BufferedReader br = new BufferedReader(
new InputStreamReader(connection.getInputStream(), "UTF-8"));
String line;
while((line = br.readLine()) != null){
System.out.println(line);
}
br.close();
다음 출력이 표시됩니다.
?}? v? 8 ???? ...
그래서 내가 뭘 잘못하고 있니? 정보를 수집하려는 사이트가 utf-8을 사용한다는 것을 알고 있습니다.
편집 : 나는 현재 Crotia에 있습니다. 세르비아 (고향)에서 일했던 다른 프로그램을 시도했지만 여기서는 작동하지 않습니다.
g-zip입니다. 을 사용하여 볼 수 있습니다 connection.getContentEncoding()
.
GZIPInputStream
주위 를 사용하면 connection.getInputStream()
더 잘 작동합니다.
BufferedReader br = new BufferedReader(
new InputStreamReader(new GZIPInputStream(connection.getInputStream()), "UTF-8"));
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다