html使用cheerio js和node js抓取td元素

西瓦库玛·西瓦拉曼(Sivakumar Sivaraman)

我有许多具有以下结构的html文件。我需要从下面获取值'GET'和' http:// localhost:5601 / app / sense '。但是在所有文档中,它们都是不完全相同的值,无论是发布,放置还是删除。但html结构相同。

<colgroup>
      <col class="col-lg-1">
      <col class="col-lg-7">
   </colgroup>
   <tbody>
      <tr>
         <td>
            <code>Method</code>
         </td>
         <td>GET</td>
      </tr>
      <tr>
         <td>
            <code>URL Path &amp; Params</code>
         </td>
         <td>http://localhost:5601/app/sense</td>
      </tr>
   </tbody>
</table>

关于如何用cheerio做到这一点的任何建议?我正在尝试通过HTML表解析td元素中的方法和URL值,但是我没有运气。

glob(__dirname + "/../docs/*/*/*/*/*/*.html", function (er, files) {
    for (var i = 0; i < files.length; i++) {

        fs.readFile(files[i], (err, data) => {
            if (err) throw err;
            $ = cheerio.load(data);
            $('tr').each(function () {
                console.log($('td').val());
            });
        });

    }
});
阿德内

您必须定位每个TD并获取文本,它没有任何价值

glob(__dirname + "/../docs/*/*/*/*/*/*.html", function (er, files) {
    for (var i = 0; i < files.length; i++) {

        fs.readFile(files[i], (err, data) => {
            if (err) throw err;
            var $ = cheerio.load(data);

            var method = $('tr').eq(0).find('td').eq(1).text();
            var url    = $('tr').eq(1).find('td').eq(1).text();

        });

    }
});

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

我可以在node.js中使用cheerio软件包加载本地html文件吗?

来自分类Dev

Cheerio JS HTML

来自分类Dev

如何使用node.js + cheerio指定xhr请求?

来自分类Dev

使用带有Cheerio的Node.js预处理HTML

来自分类Dev

如何将抓取内容放入html(Node.js,Cheerio)

来自分类Dev

按钮更新node.js和HTML

来自分类Dev

如何使用Cheerio js删除<div>和<br>?

来自分类Dev

使用Cheerio Node.js抓取表格数据

来自分类Dev

如何使用node.js Cheerio一一获取元素

来自分类Dev

使用node.js和mongoose的mapReduce

来自分类Dev

安装和使用Node JS

来自分类Dev

如何使用Node.js抓取页面

来自分类Dev

使用KaTeX和Node.js生成HTML

来自分类Dev

使用请求模块抓取Node.js

来自分类Dev

如何使用Cheerio和Puppeter将HTML网站抓取到JSON中?

来自分类Dev

使用Node JS和MongoDB过滤查询

来自分类Dev

使用Node.js进行Web抓取

来自分类Dev

如何使用node.js + cheerio指定xhr请求?

来自分类Dev

Netbeans和Node.js使用

来自分类Dev

使用Cheerio Node.js抓取表格数据

来自分类Dev

使用请求承诺和Node.js缓存HTML

来自分类Dev

安装和使用Node JS

来自分类Dev

如何使用Node.js抓取页面

来自分类Dev

使用cheerio获取所有包含的js

来自分类Dev

Cheerio - Node js 抓取评论和星星数量

来自分类Dev

使用cheerio js进行节点遍历

来自分类Dev

Node JS 请求和cheerio HTML 页面错误

来自分类Dev

使用 `replace` 和 Node.js 函数

来自分类Dev

使用node.js和cheerio抓取OP.GG网站的问题