如何使用node.js获取所有网页资源?例如图片,CSS表格和javascript。
我用
var http = require('http');
var options = {method: 'HEAD', host: 'www.baidu.com', port: 80, path: '/'};
var req = http.request(options, function(res) {
var req = http.request(options, function(res) {
console.log(JSON.stringify(res.headers));
}
);
只能获得一个文件头。
{"date":"Fri, 26 Dec 2014 12:41:27 GMT","content-type":"text/html","content-length":"14613","last-modified":"Wed, 03 Sep
2014 02:48:32 GMT","connection":"Keep-Alive","vary":"Accept-Encoding","set-cookie":["BAIDUID=CC1720480D2B6CCCE857D20A27
B203D3:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com","BAIDUPSID=CC1720480D2B
6CCCE857D20A27B203D3; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com","BDSVRTM=0; pa
th=/"],"p3p":"CP=\" OTI DSP COR IVA OUR IND COM \"","server":"BWS/1.1","pragma":"no-cache","cache-control":"no-cache","b
dpagetype":"1","bdqid":"0xb6908e1e0000cf99","bduserid":"0","accept-ranges":"bytes"}
希望有人能帮助我。请 谢谢。
您正在获取标头,因为您需要输入::method: 'HEAD'
。要获得实际的网页,您需要使用method GET
。
至于获取其他资源,您需要解析结果页面,查找对外部javascript,CSS和图像的引用,并在链接上执行GET,没有捷径。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句