无头铬浏览器命令语法问题

里克·T

我遇到了无头铬浏览器无法正确创建html文件的问题。唯一创建的内容/文件是单个{} .html文件

我的domains.txt包含:

https://ibm.com/ 
https://www.linux.org/whats-new/

PS:我正在使用Ubuntu 18.04 64位linux

我使用的命令如下:

cat domains.txt | xargs -I {} -P 4 sh -c timeout 25s chromium-browser --headless --no-sandbox --user-agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' --dump-dom https://{} 2> /dev/null > {}.html

这是从此链接中获取的

库萨兰达

编码:

cat domains.txt | xargs -I {} -P 4 sh -c timeout 25s chromium-browser --headless --no-sandbox --user-agent='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36' --dump-dom https://{} 2> /dev/null > {}.html

缺少有关的引号sh -c如果引用正确,它还会将sh -c来自的代码注入脚本中xargs,这是一个安全漏洞。

管道写得更好

xargs -I {} -P 4 sh -c '
    timeout 25s chromium-browser \
        --headless --no-sandbox \
        --user-agent="Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537. 36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36" \
        --dump-dom \
        "https://$1" 2>/dev/null >"$1.html"' sh {} <domains.txt

...,但请注意,这仍然会写入称为“东西”的文件,例如,https://ibm.com/.html如果文件中有这些字符串domains.txt(即,写入名称怪异的子目录中的文件),并且它将尝试获取诸如“ URL”之类的URL https://https://ibm.com/

我认为目的是在domains.txt文件中仅保留实际的域,而不保留完整的URL ,即

ibm.com
www.linux.org

就个人而言,我宁愿使用来做一个更简单的解决方案curl

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

什么是与量角器一起运行的良好的无头浏览器?

来自分类Dev

无头浏览器和Windows Azure网站

来自分类Dev

如何在Chutzpah的无头浏览器中使用templateUrl测试指令

来自分类Dev

在Heroku Rails Unicorn堆栈中使用无头浏览器

来自分类Dev

在Mac上使用xvfb无头运行Safari浏览器

来自分类Dev

无法使用Python中的无头浏览器提交表单/登录到Nike.com

来自分类Dev

具有下载功能的无头浏览器测试?

来自分类Dev

模块版本与无头浏览器和桌面节点不匹配

来自分类Dev

在Selenium中将PhantomJS用于无头浏览器-Python

来自分类Dev

无头浏览器的自动测试如何与真实浏览器中的测试相辅相成?

来自分类Dev

浏览器合成器问题-铬与铬

来自分类Dev

无头的谷歌浏览器:如何防止网站知道其窗口是否聚焦

来自分类Dev

浏览器操作不适用于无头Chrome

来自分类Dev

Javascript循环,异步功能和无头浏览器

来自分类Dev

无头Chrome元素不可点击(在浏览器模式下工作)

来自分类Dev

使用Selenium Python客户端在不同的浏览器中处理无头模式

来自分类Dev

无法在无头浏览器中加入由lib-jitsi-meet创建的会议

来自分类Dev

如何使用无头浏览器运行Selenium Python

来自分类Dev

铬浏览器记录画布动画回放问题

来自分类Dev

如何在Cypress中将默认的无头浏览器更改为Chrome

来自分类Dev

Windows环境中有多个无头浏览器?

来自分类Dev

铬浏览器:超出数据上限

来自分类Dev

无头浏览器是否需要提防robots.txt?

来自分类Dev

浏览器合成器问题-铬与铬

来自分类Dev

如何在无头浏览器中使用不同版本的渲染引擎渲染网页?

来自分类Dev

支持JS for .Net的无头浏览器

来自分类Dev

铬浏览器的多个实例

来自分类Dev

在无头浏览器(PhantomJS)中异步打开页面

来自分类Dev

如何以无头模式启动铬浏览器?显示屏“:99”缺少扩展名“ RANDR”

Related 相关文章

  1. 1

    什么是与量角器一起运行的良好的无头浏览器?

  2. 2

    无头浏览器和Windows Azure网站

  3. 3

    如何在Chutzpah的无头浏览器中使用templateUrl测试指令

  4. 4

    在Heroku Rails Unicorn堆栈中使用无头浏览器

  5. 5

    在Mac上使用xvfb无头运行Safari浏览器

  6. 6

    无法使用Python中的无头浏览器提交表单/登录到Nike.com

  7. 7

    具有下载功能的无头浏览器测试?

  8. 8

    模块版本与无头浏览器和桌面节点不匹配

  9. 9

    在Selenium中将PhantomJS用于无头浏览器-Python

  10. 10

    无头浏览器的自动测试如何与真实浏览器中的测试相辅相成?

  11. 11

    浏览器合成器问题-铬与铬

  12. 12

    无头的谷歌浏览器:如何防止网站知道其窗口是否聚焦

  13. 13

    浏览器操作不适用于无头Chrome

  14. 14

    Javascript循环,异步功能和无头浏览器

  15. 15

    无头Chrome元素不可点击(在浏览器模式下工作)

  16. 16

    使用Selenium Python客户端在不同的浏览器中处理无头模式

  17. 17

    无法在无头浏览器中加入由lib-jitsi-meet创建的会议

  18. 18

    如何使用无头浏览器运行Selenium Python

  19. 19

    铬浏览器记录画布动画回放问题

  20. 20

    如何在Cypress中将默认的无头浏览器更改为Chrome

  21. 21

    Windows环境中有多个无头浏览器?

  22. 22

    铬浏览器:超出数据上限

  23. 23

    无头浏览器是否需要提防robots.txt?

  24. 24

    浏览器合成器问题-铬与铬

  25. 25

    如何在无头浏览器中使用不同版本的渲染引擎渲染网页?

  26. 26

    支持JS for .Net的无头浏览器

  27. 27

    铬浏览器的多个实例

  28. 28

    在无头浏览器(PhantomJS)中异步打开页面

  29. 29

    如何以无头模式启动铬浏览器?显示屏“:99”缺少扩展名“ RANDR”

热门标签

归档