用于排除<article>中的内容的HTML5标记/属性

艾米·内维尔(Amy Neville)

有什么方法可以使网络爬虫/机器人清楚文章或部分中包含的内容与该文章无关吗?

<article>
    <section>
        <div>
            <span>Amy Neville</span>
            <img src="http://www.example.com/amy.png">
            <span>Joined <time>5 Days</time> ago</span>
            <span>41525 Points</span>
        </div>
        <p>Mary, the only surviving legitimate child of King James V of Scotland, was six days old when her father died and she acceded to the throne. She spent most of her childhood in France while Scotland was ruled by regents, and in 1558, she married the Dauphin of France, Francis. He ascended the French throne as King Francis II in 1559, and Mary briefly became queen consort of France, until his death in December 1560.</p>
    </section>
</article>

在上面的示例中,我有一个论坛帖子。它的旁边是<div>与发布者有关的一些不相关信息。不相关,但可能与实际文章内容混淆。

是否有任何标记或属性可以使这一点变得清楚?

螺栓时钟

一般来说,如果一个切片元素包含的信息完全不相干的该部分的内容,你可以得到最接近的是一个<aside>元素。


有关文章发表者的信息与该文章相关,因为它描述了该文章的作者。它不构成本文内容一部分,但是仍然是相关的。

话虽如此,您可以使用<header><footer>标记sectioning元素内的作者信息。您甚至可以<footer>在本节的开头添加-可能看起来很奇怪,但是完全没问题(请参阅描述<article>element规范)。

<article>
    <section>
        <footer>
            <span>Amy Neville</span>
            <img src="http://www.example.com/amy.png">
            <span>Joined <time>5 Days</time> ago</span>
            <span>41525 Points</span>
        </footer>
        <p>Mary, the only surviving legitimate child of King James V of Scotland, was six days old when her father died and she acceded to the throne. She spent most of her childhood in France while Scotland was ruled by regents, and in 1558, she married the Dauphin of France, Francis. He ascended the French throne as King Francis II in 1559, and Mary briefly became queen consort of France, until his death in December 1560.</p>
    </section>
</article>

除了元素之外,没有用于标记作者信息的专用元素<address>,但是<address>用于联系信息。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

HTML5中<article>内的<main>

来自分类Dev

<article> HTML5标签的Xpath

来自分类Dev

html5标记或div用于性能

来自分类Dev

用于Google Article Rich Snippet的带有'mainEntityOfPage'的微数据标记

来自分类Dev

正确的HTML5标记,用于有序列表中的标题

来自分类Dev

CSS选择器,用于按属性存在排除

来自分类Dev

Java中用于HttpURLConnections的Range属性是包含的还是排除的?

来自分类Dev

表格中用于分组标题的HTML5标记?

来自分类Dev

表格中用于分组标题的HTML5标记?

来自分类Dev

正则表达式用于python中的单词排除

来自分类Dev

如何在HTML5中使用<section>和<article>标签?

来自分类Dev

html5中的<article>和<section>有什么区别

来自分类Dev

在HTML5中,关于<article>的<footer>元素的出现顺序是否重要?

来自分类Dev

如何在HTML5中使用<section>和<article>标签?

来自分类Dev

MSHTML无效的分析ARTICLE标记

来自分类Dev

SQL LEFT JOIN用于连接三个表,但一个用于排除内容

来自分类Dev

Visualforce松散的HTML5属性(用于相关选择列表)

来自分类Dev

在Android中使用jsoup在<article>标记内获取内容

来自分类Dev

用于 FB 共享的元标记 - 我是否也需要使用常规元标记?什么类型用于 html5 游戏?

来自分类Dev

正确的HTML5标记,用于浮动徽标,标语和2个导航

来自分类Dev

用于JSF直通输入元素的转换器(“ HTML5友好标记”)

来自分类Dev

findElement by.xpath无法用于HTML5部分标记?

来自分类Dev

正确的HTML5标记,用于浮动徽标,标语和2个导航

来自分类Dev

正则表达式,用于排除Java中超过2个“ ==”的模式

来自分类Dev

VB脚本,用于从文本中检查,下载和安装Microsoft的Windows更新以及排除项

来自分类Dev

用于排除其他表中存在的数据的 LINQ sql 表达式

来自分类Dev

用于排除的 SQL

来自分类Dev

用PHP排除其中的特定html标记和内容

来自分类Dev

Django-创建与Article的HTML相关的图像

Related 相关文章

  1. 1

    HTML5中<article>内的<main>

  2. 2

    <article> HTML5标签的Xpath

  3. 3

    html5标记或div用于性能

  4. 4

    用于Google Article Rich Snippet的带有'mainEntityOfPage'的微数据标记

  5. 5

    正确的HTML5标记,用于有序列表中的标题

  6. 6

    CSS选择器,用于按属性存在排除

  7. 7

    Java中用于HttpURLConnections的Range属性是包含的还是排除的?

  8. 8

    表格中用于分组标题的HTML5标记?

  9. 9

    表格中用于分组标题的HTML5标记?

  10. 10

    正则表达式用于python中的单词排除

  11. 11

    如何在HTML5中使用<section>和<article>标签?

  12. 12

    html5中的<article>和<section>有什么区别

  13. 13

    在HTML5中,关于<article>的<footer>元素的出现顺序是否重要?

  14. 14

    如何在HTML5中使用<section>和<article>标签?

  15. 15

    MSHTML无效的分析ARTICLE标记

  16. 16

    SQL LEFT JOIN用于连接三个表,但一个用于排除内容

  17. 17

    Visualforce松散的HTML5属性(用于相关选择列表)

  18. 18

    在Android中使用jsoup在<article>标记内获取内容

  19. 19

    用于 FB 共享的元标记 - 我是否也需要使用常规元标记?什么类型用于 html5 游戏?

  20. 20

    正确的HTML5标记,用于浮动徽标,标语和2个导航

  21. 21

    用于JSF直通输入元素的转换器(“ HTML5友好标记”)

  22. 22

    findElement by.xpath无法用于HTML5部分标记?

  23. 23

    正确的HTML5标记,用于浮动徽标,标语和2个导航

  24. 24

    正则表达式,用于排除Java中超过2个“ ==”的模式

  25. 25

    VB脚本,用于从文本中检查,下载和安装Microsoft的Windows更新以及排除项

  26. 26

    用于排除其他表中存在的数据的 LINQ sql 表达式

  27. 27

    用于排除的 SQL

  28. 28

    用PHP排除其中的特定html标记和内容

  29. 29

    Django-创建与Article的HTML相关的图像

热门标签

归档