为什么下载html并将其另存为硬盘上的文件时,html文件的内容与查看源的内容不同?

丹尼尔·利普(Daniel Lip)

这是原始的html网址:http ://www.tapuz.co.il/forums2008/forumpage.aspx?forumid = 393&pagenumber =1

原始链接

这就是我下载html的方式:

private void GetHtml()
        {
            for (int i = 1; i < 2; i++)
            {
                webclient.DownloadFile(sourceUrl + i, combinedHtmlsDir + "\\Page" + i + ".html");
            }
        }

我在保存的html文件上得到的内容是:这是内容的顶行:

<!DOCTYPE html>
<html>
<head>
        <meta http-equiv="X-UA-Compatible" content="IE=edge" />

        <meta name="description" content="פורום מזג האוויר - תפוז פורומים, קהילות בכל נושא שבעולם. בואו לדבר על מזג האוויר במערכת הפורומים הטובה ביותר ברשת." />

        <meta name="keywords" content="פורום, פורומים, קהילות, מאמרים, מידע, דיון, תגובות ,תפוז, תפוז אנשים,מזג האוויר" />

这是页面view-source的顶行:

<!DOCTYPE html>
<html>
<head>
        <meta http-equiv="X-UA-Compatible" content="IE=edge" />

        <meta name="description" content="מתעניינים במזג האוויר? רוצים לקבל מידע אונליין על המתרחש? היכנסו לפורום מזג אוויר בתפוז!" />

        <meta name="keywords" content="פורום, פורומים, קהילות, מאמרים, מידע, דיון, תגובות ,תפוז, תפוז אנשים,מזג האוויר, מזג אויר, חיזוי, אקלים, אטמוספירה, גשמים, חום, קור, משקעים, גשם, רוחות, רוח, עננות, עננים, ענן, צירוס, קומולוס, צירוסים, קומולוסים, קרה, ברד, קר, חם, מזג אוויר, לחות, nzd vtuuhr, דני רופ, מטאורולוג" />

内容不一样。如何下载视图源的相同内容?我从中下载的链接可能与查看源的链接不同吗?

我现在还测试了是否要浏览网站到页面,然后用鼠标右键单击,然后另存为并将其另存为:网页,HTML只有这样,我的硬盘上的html文件才是311KB尺寸。

但是使用我的程序,硬盘上的html文件大小仅为77KB。

我不知道为什么它不能像在执行另存为一样在程序中为我保存相同内容和大小的html文件。

pcwizz

如果页面是动态的(内容将会更改),我怀疑您的问题是内容在视图源和下载之间发生了变化。

如果不是这种情况,请检查浏览器/ js是否更改了您在视图源中看到的DOM树,或者该网站是否可能根据用户代理更改了其内容。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

从HTML获取数据并将其另存为PHP变量

来自分类Dev

将文本文件内容另存为图像

来自分类Dev

将页面与内容一起另存为html

来自分类Dev

在jsdom窗口中编辑元素并将该窗口另存为新的HTML文件吗?

来自分类Dev

将HTML图像输入另存为Java文件

来自分类Dev

是否应将静态文件另存为TXT或CFM或HTML?

来自分类Dev

如何将html文件另存为pdf?

来自分类Dev

将HTML图像输入另存为Java文件

来自分类Dev

从html2canvas保存或另存为对话框时的默认文件名?

来自分类Dev

使用pd.read_csv()读取多个文件,并将每个文件另存为不同的变量

来自分类Dev

运行打开文件并将其另存为值的宏的宏-运行时错误1004

来自分类Dev

JavaScript-从文件中读取URL并将其另存为数组中的元素

来自分类Dev

将边界框区域转换为遮罩并将其另存为PNG文件

来自分类Dev

获取日期并将其另存为文件名python

来自分类Dev

如何使用OpenOffice打开Excel文件并将其另存为CSV

来自分类Dev

将水印添加到图像,并将其另存为图像而不是php文件

来自分类Dev

Shell脚本从文件列表中提取数据并将其另存为csv

来自分类Dev

在Matlab中创建表并将其另存为.mat文件

来自分类Dev

复制工作表中的范围并将其粘贴并另存为新的用户指定文件

来自分类Dev

将准备好的布局转换为位图并将其另存为文件中的图像

来自分类Dev

OSX-使用Swift加载图像并将其另存为较小的png文件

来自分类Dev

如何将我的输出转换为 .JSON 并将其另存为 .json 文件

来自分类Dev

如何在 HIVE 中创建 DDL 并将其另存为目录中的文件

来自分类Dev

如何读取模板文件的内容进行更改并另存为新文件?

来自分类Dev

pdf文件另存为当前页面源

来自分类Dev

使用cocos2d-x将精灵内容另存为.png文件

来自分类Dev

如何将CanvasControl的内容另存为图像文件

来自分类Dev

将 Word 文档中提取的内容另存为 CSV 文件

来自分类Dev

Python:读取csv文件并将列另存为变量

Related 相关文章

  1. 1

    从HTML获取数据并将其另存为PHP变量

  2. 2

    将文本文件内容另存为图像

  3. 3

    将页面与内容一起另存为html

  4. 4

    在jsdom窗口中编辑元素并将该窗口另存为新的HTML文件吗?

  5. 5

    将HTML图像输入另存为Java文件

  6. 6

    是否应将静态文件另存为TXT或CFM或HTML?

  7. 7

    如何将html文件另存为pdf?

  8. 8

    将HTML图像输入另存为Java文件

  9. 9

    从html2canvas保存或另存为对话框时的默认文件名?

  10. 10

    使用pd.read_csv()读取多个文件,并将每个文件另存为不同的变量

  11. 11

    运行打开文件并将其另存为值的宏的宏-运行时错误1004

  12. 12

    JavaScript-从文件中读取URL并将其另存为数组中的元素

  13. 13

    将边界框区域转换为遮罩并将其另存为PNG文件

  14. 14

    获取日期并将其另存为文件名python

  15. 15

    如何使用OpenOffice打开Excel文件并将其另存为CSV

  16. 16

    将水印添加到图像,并将其另存为图像而不是php文件

  17. 17

    Shell脚本从文件列表中提取数据并将其另存为csv

  18. 18

    在Matlab中创建表并将其另存为.mat文件

  19. 19

    复制工作表中的范围并将其粘贴并另存为新的用户指定文件

  20. 20

    将准备好的布局转换为位图并将其另存为文件中的图像

  21. 21

    OSX-使用Swift加载图像并将其另存为较小的png文件

  22. 22

    如何将我的输出转换为 .JSON 并将其另存为 .json 文件

  23. 23

    如何在 HIVE 中创建 DDL 并将其另存为目录中的文件

  24. 24

    如何读取模板文件的内容进行更改并另存为新文件?

  25. 25

    pdf文件另存为当前页面源

  26. 26

    使用cocos2d-x将精灵内容另存为.png文件

  27. 27

    如何将CanvasControl的内容另存为图像文件

  28. 28

    将 Word 文档中提取的内容另存为 CSV 文件

  29. 29

    Python:读取csv文件并将列另存为变量

热门标签

归档