使用goquery提取元描述字段

罗吉尔·洛默斯

我正在使用goquery包从网页中提取信息。请在下面查看我的代码。运行该函数后的结果是:

Description field: text/html; charset=iso-8859-15
Description field: width=device-width
Description field: THIS IS THE TEXT I WANT TO EXTRACT

我快到了,但是我只想获取名称=='description'的meta字段。不幸的是,我不知道如何在我的代码中添加这个额外条件。

func ExampleScrapeDescription() {
    htmlCode :=
        `<!doctype html>
<html lang="NL">
    <head>
        <meta http-equiv="content-type" content="text/html; charset=iso-8859-15">
        <meta name="viewport" content="width=device-width">
        <meta name="description" content="THIS IS THE TEXT I WANT TO EXTRACT">
        <title>page title</title>
    </head>
    <body class="fixedHeader">
        page body
    </body>
</html>`

    doc, err := goquery.NewDocumentFromReader(strings.NewReader((htmlCode)))
    if err != nil {
        log.Fatal(err)
    }

    doc.Find("meta").Each(func(i int, s *goquery.Selection) {
        description, _ := s.Attr("content")
        fmt.Printf("Description field: %s\n", description)
    })
}
icza

只需检查name属性是否匹配"description"

doc.Find("meta").Each(func(i int, s *goquery.Selection) {
    if name, _ := s.Attr("name"); name == "description" {
        description, _ := s.Attr("content")
        fmt.Printf("Description field: %s\n", description)
    }
})

您可能需要以name不区分大小写的方式比较属性的值,为此您可以使用strings.EqualFold()

if name, _ := s.Attr("name"); strings.EqualFold(name, "description") {
    // proceed to extract and use the content of description
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用R从网页提取元描述

来自分类Dev

如何使用python从URL中提取元描述?

来自分类Dev

如何使用python从URL中提取元描述?

来自分类Dev

从常量字段中提取描述属性

来自分类Dev

使用Javascript查找元“描述”

来自分类Dev

使用未分配的字段符号描述字段

来自分类Dev

Symfony的DomCrawler如何从html源提取元描述

来自分类Dev

元描述

来自分类Dev

如何在元描述中使用®

来自分类Dev

使用Grep和/或RegEx从R中的元数据字段提取ID的模式匹配

来自分类Dev

GoQuery选择提取器不起作用

来自分类Dev

使用Java提取JSON字段

来自分类Dev

如何使用ejs模板在Sailsjs中设置元描述标签?

来自分类Dev

使用Selenium IDE检查是否存在元描述?

来自分类Dev

使用切片从元标记描述中删除“ The”

来自分类Dev

PHP不从自定义字段中提取元数据

来自分类Dev

使用OpenCV从小图像中提取点描述符

来自分类Dev

WordPress替换元描述

来自分类Dev

覆盖自动元描述

来自分类Dev

如何使用MATLAB提取图像元数据?

来自分类Dev

使用SQL向BigQuery中的字段添加描述

来自分类Dev

WooCommerce允许在类别描述字段中使用html语法

来自分类Dev

使用 R 将超链接传递给 JIRA“描述”字段

来自分类Dev

新标准字段“描述”

来自分类Dev

在C中使用struct提取位字段

来自分类Dev

使用jq提取可变数量的字段

来自分类Dev

使用sed提取特定的分隔字段

来自分类Dev

使用SQL从字段中提取数值数据

来自分类Dev

使用grep快速提取字段