搜索

搜索

无头铬浏览器命令语法问题

debugcn 发表于 Dev

9

里克·T

我遇到了无头铬浏览器无法正确创建html文件的问题。唯一创建的内容/文件是单个{} .html文件

我的domains.txt包含：

https://ibm.com/ 
https://www.linux.org/whats-new/

PS：我正在使用Ubuntu 18.04 64位linux

我使用的命令如下：

cat domains.txt | xargs -I {} -P 4 sh -c timeout 25s chromium-browser --headless --no-sandbox --user-agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' --dump-dom https://{} 2> /dev/null > {}.html

这是从此链接中获取的

库萨兰达

编码：

cat domains.txt | xargs -I {} -P 4 sh -c timeout 25s chromium-browser --headless --no-sandbox --user-agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' --dump-dom https://{} 2> /dev/null > {}.html

缺少有关的引号sh -c。如果引用正确，它还会将sh -c来自的代码注入脚本中xargs，这是一个安全漏洞。

管道写得更好

xargs -I {} -P 4 sh -c '
    timeout 25s chromium-browser \
        --headless --no-sandbox \
        --user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36" \
        --dump-dom \
        "https://$1" 2>/dev/null >"$1.html"' sh {} <domains.txt

...，但请注意，这仍然会写入称为“东西”的文件，例如，https://ibm.com/.html如果文件中有这些字符串domains.txt（即，写入名称怪异的子目录中的文件），并且它将尝试获取诸如“ URL”之类的URL https://https://ibm.com/。

我认为目的是在domains.txt文件中仅保留实际的域，而不保留完整的URL ，即

ibm.com
www.linux.org

就个人而言，我宁愿使用来做一个更简单的解决方案curl。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-29

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

什么是与量角器一起运行的良好的无头浏览器？

来自分类Dev

无头浏览器和Windows Azure网站

来自分类Dev

如何在Chutzpah的无头浏览器中使用templateUrl测试指令

来自分类Dev

在Heroku Rails Unicorn堆栈中使用无头浏览器

来自分类Dev

在Mac上使用xvfb无头运行Safari浏览器

来自分类Dev

无法使用Python中的无头浏览器提交表单/登录到Nike.com

来自分类Dev

具有下载功能的无头浏览器测试？

来自分类Dev

模块版本与无头浏览器和桌面节点不匹配

来自分类Dev

在Selenium中将PhantomJS用于无头浏览器-Python

来自分类Dev

无头浏览器的自动测试如何与真实浏览器中的测试相辅相成？

来自分类Dev

浏览器合成器问题-铬与铬

来自分类Dev

无头的谷歌浏览器：如何防止网站知道其窗口是否聚焦

来自分类Dev

浏览器操作不适用于无头Chrome

来自分类Dev

Javascript循环，异步功能和无头浏览器

来自分类Dev

无头Chrome元素不可点击（在浏览器模式下工作）

来自分类Dev

使用Selenium Python客户端在不同的浏览器中处理无头模式

来自分类Dev

无法在无头浏览器中加入由lib-jitsi-meet创建的会议

来自分类Dev

如何使用无头浏览器运行Selenium Python

来自分类Dev

铬浏览器记录画布动画回放问题

来自分类Dev

如何在Cypress中将默认的无头浏览器更改为Chrome

来自分类Dev

Windows环境中有多个无头浏览器？

来自分类Dev

铬浏览器：超出数据上限

来自分类Dev

无头浏览器是否需要提防robots.txt？

来自分类Dev

浏览器合成器问题-铬与铬

来自分类Dev

如何在无头浏览器中使用不同版本的渲染引擎渲染网页？

来自分类Dev

支持JS for .Net的无头浏览器

来自分类Dev

铬浏览器的多个实例

来自分类Dev

在无头浏览器（PhantomJS）中异步打开页面

来自分类Dev

如何以无头模式启动铬浏览器？显示屏“：99”缺少扩展名“ RANDR”

Related 相关文章

文章

热门标签

归档