当我使用BufferedReader获取HTML时，我需要的部分不在那里

debugcn 发表于 Dev

缺口

因此，我将这样的代码从站点中某个站点的标签中获取值：

    try {

        URL url = new URL("google.com");
        BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));

        String inputLine;
        while (in.readLine() != null) {

            inputLine = in.readLine();
        }
        in.close();


    } catch (IOException e) {

        e.printStackTrace();

    }

所以说我需要它来找到“ Pizza”，但是只有一些代码会弹出，所以我无法访问该部分，所以有一种方法可以打印出整个HTML（使用BufferReader，并且没有像Jsoup这样的多余导入），然后检查它？

西尔马吉德

  URL url = new URL("http://www.google.com");
URLConnection uc = url.openConnection();

InputStreamReader input = new InputStreamReader(uc.getInputStream());
BufferedReader in = new BufferedReader(input);
String inputLine;

 FileWriter outFile = new FileWriter("orhancan");
 PrintWriter out = new PrintWriter(outFile);

while ((inputLine = in.readLine()) != null) {
    out.println(inputLine);
}

in.close();
out.close();

File fXmlFile = new File("orhancan");
DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(fXmlFile);


NodeList prelist = doc.getElementsByTagName("body");
System.out.println(prelist.getLength());

有一种更简单的方法可以做到这一点。我建议使用JSoup。使用JSoup，您可以做类似的事情。json文件doc = Jsoup.connect（“ http://en.wikipedia.org/ ”）.get（）; 元素newsHeadlines = doc.select（“＃mp-itn b a”）; 或者，如果您想要身体：

Elements body = doc.select("body");

或者，如果您需要所有链接：

Elements links = doc.select("body a");

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-16

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

当我使用BufferedReader获取HTML时，我需要的部分不在那里

当我使用BufferedReader获取HTML时，我需要的部分不在那里

我是否需要在那里显式使用flush（）方法？

我收到FileNotFoundException但文件在那里

我有一个aspx（vb）网站。当我尝试删除.vb文件（在那里保留.aspx文件）时，总是会出现HttpParseException？

列在那里，但是当我尝试删除它时，它说MYSQL中没有列？**错误代码：1091。无法删除... **

列在那里，但是当我尝试删除它时，它说MYSQL中没有列？**错误代码：1091。无法删除... **

“ parcella_pk”在那里不行，它导致“ ValueError”。我应该使用什么？

如何在MVC4中使用href？我被困在那里

无法选择我的领域，也无法使用 codeception 在那里写字

卡夫卡流：实现一个简单的KeyValueStore在那里我可以把和获取数据

为什么我们在那里使用一个monoid和一个函子？

你如何使用 lambda 连接到 RDS，我应该在那里放置查询吗？

我的/ boot分区坏了。我该如何写在那里所需的一切？

在我网站的导航栏中，可点击的部分比我想要的要多。他们为什么在那里？

为什么不在那里调用普通函数？

Vim说'missing：endif'，但是我确定它在那里

Django找不到我的基本模板，但是它在那里

为什么我会收到“ -bash：'alias：命令未找到”，但它在那里..？

我收到未定义索引的通知，但是索引在那里

Cookie在那里，但我无法在CodeIgniter中获得它们。为什么？

Vim说'missing：endif'，但是我确定它在那里

无论如何，我在那里定义了jsoncschema中的字典？

我可以在console.debug（）并使Chrome Dev-tools断点在那里吗？

X.org 配置文件在哪里？我如何在那里配置 X？

Firebase 说我在 Manifest 中缺少一行，但它在那里

索引超出范围，但我知道列在那里

如何解决“问候，时间旅行家。我们正处在无前缀CSS的黄金时代，在那里样式表不再需要Autoprefixer。”

Python：有什么方法可以让我使用脚本并将其内容导入空闲状态以便在那里编辑它们？

Android Dagger 2在那里时要求@Provides

ImportError：当模块在那里时，没有模块被命名

列在那里，但是当我尝试删除它时，它说MYSQL中没有列？错误代码：1091。无法删除...

列在那里，但是当我尝试删除它时，它说MYSQL中没有列？错误代码：1091。无法删除...