有没有一种方法可以禁止wget从父目录获取文件到给定深度?

格林曼

wget具有-np禁止从任何父目录获取文件的选项我需要类似的东西,但要灵活一些。考虑:

www.foo.com/bar1/bar2/bar3/index.html

我想得到所有东西,但不是(在树层次结构中)比bar2(!)“更高” 因此bar2也应该获取而不是获取bar1

有没有办法使wget更具选择性?

背景:我正在尝试镜像具有类似逻辑结构的网站-起点,然后是向上,然后是向下。如果除之外还有其他工具wget更适合此类布局,请也告诉我。

更新

或者,而不是指定可能的深度,例如“没有父母,除非他们匹配此URL”。

更新2

服务器上有一些结构,对吗?您可以将其可视化为树。因此,通常使用“ --no-parent”,您会从A点开始,然后一直下降。

我的愿望是向上的能力-可以说,允许向上X个节点,或者(相当于100%)允许向上B个节点(距离BA = X)。

在所有情况下,下降规则都由用户定义(例如,仅下降Y级)。

怎么存放呢?实际上,这并不是真正的问题-wget默认情况下会重新创建服务器结构,这里没有什么可担心的,或者不需要修复任何内容。因此,与往常一样,用2个字表示。

更新3

下面的目录结构-假设每个目录中R-R.html等只有一个文件。当然,这可以简化,因为您可以拥有多个页面。

        R 
       / \
      B   G
     / \
    C   F
   / \
  A   D
 /
E 

A(A.html)是我的起点,X = 2(所以B是我想获取的最顶层节点)。在此特定示例中,这意味着获取除R.html和G.html之外的所有页面。A.html被称为“起点”,因为我必须从它而不是从B开始。

更新4

从更新3开始使用命名。

wget选项www.foo.com/B/C/A/A.html

问题是从目录B及其以下获取所有页面的选项是什么(知道您必须从A.html开始)。

程序

我没有尝试过,但是使用-I和-X可以满足您的需求。我的第一个尝试是

wget -m -I bar1/bar2 -X "*" http://www.foo.com/bar1/bar2/bar3/index.html

选项说明:

-m: 
   --mirror
       Turn on options suitable for mirroring.  This option turns on recursion and time-stamping, sets
       infinite recursion depth and keeps FTP directory listings.  It is currently equivalent to -r -N -l
       inf --no-remove-listing.
-I: list
   --include-directories=list
       Specify a comma-separated list of directories you wish to follow when downloading.  Elements of
       list may contain wildcards.
-X: list
   --exclude-directories=list
       Specify a comma-separated list of directories you wish to exclude from download.  Elements of list
       may contain wildcards.

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

有没有一种方法可以禁止wget从父目录获取文件到给定深度?

来自分类Dev

有没有一种方法可以在wix中获取目录的实际路径?

来自分类Dev

有没有一种方法可以kubectl应用目录中的每个文件?

来自分类Dev

有没有一种方法可以通过curl或wget命令从页面下载所有.txt文件

来自分类Dev

有没有一种方法可以禁止发送ResendRequest消息?

来自分类Dev

有没有一种方法可以禁止平板电脑上的平移-网站?

来自分类Dev

有没有一种方法可以轻松计算给定分区键的令牌?

来自分类Dev

有没有一种方法可以使用〜指向Python中文件路径中的主目录?

来自分类Dev

有没有一种方法可以在PhpStorm中搜索文件夹(目录)?

来自分类Dev

有没有一种方法可以在Django中删除目录以及删除媒体文件?

来自分类Dev

有没有一种方法可以按月组织新目录中的视频文件?

来自分类Dev

有没有一种方法可以使Nautilus显示“最近使用过的”文件和目录?

来自分类Dev

有没有一种方法可以获取具有set方法的属性?

来自分类Dev

有没有一种方法可以从C ++代码添加包含目录?

来自分类Dev

有没有一种方法可以使用Python从目录创建jar?

来自分类Dev

有没有一种方法可以自动删除临时目录?

来自分类Dev

有没有一种方法可以快速浏览目录中的多个pdf?

来自分类Dev

有没有一种方法可以获取执行或编译的.java文件的文件路径?

来自分类Dev

有没有一种方法可以获取子集中的所有文档

来自分类Dev

有没有一种方法可以获取所有堆userptr的userstack

来自分类Dev

当嵌入到网页中时,有没有一种方法可以隐藏SVG文件/ xml的内容?

来自分类Dev

有没有一种方法,我可以从绑定的Windows主机到Linux容器安装点的文件?

来自分类Dev

有没有一种方法可以将随机文件从源复制到目标?

来自分类Dev

有没有一种方法可以累加我从.txt文件中检索到的整数

来自分类Dev

有没有一种方法可以浅复制现有文件对象?

来自分类Dev

有没有一种方法可以让文件大小只有FileDescriptor?

来自分类Dev

有没有一种方法可以使用Google Drive API获取文件名?

来自分类Dev

有没有一种方法可以将Dependabot的徽章生成到GitHub?

来自分类Dev

React Navigation有没有一种方法可以从父组件中引用导航器?

Related 相关文章

  1. 1

    有没有一种方法可以禁止wget从父目录获取文件到给定深度?

  2. 2

    有没有一种方法可以在wix中获取目录的实际路径?

  3. 3

    有没有一种方法可以kubectl应用目录中的每个文件?

  4. 4

    有没有一种方法可以通过curl或wget命令从页面下载所有.txt文件

  5. 5

    有没有一种方法可以禁止发送ResendRequest消息?

  6. 6

    有没有一种方法可以禁止平板电脑上的平移-网站?

  7. 7

    有没有一种方法可以轻松计算给定分区键的令牌?

  8. 8

    有没有一种方法可以使用〜指向Python中文件路径中的主目录?

  9. 9

    有没有一种方法可以在PhpStorm中搜索文件夹(目录)?

  10. 10

    有没有一种方法可以在Django中删除目录以及删除媒体文件?

  11. 11

    有没有一种方法可以按月组织新目录中的视频文件?

  12. 12

    有没有一种方法可以使Nautilus显示“最近使用过的”文件和目录?

  13. 13

    有没有一种方法可以获取具有set方法的属性?

  14. 14

    有没有一种方法可以从C ++代码添加包含目录?

  15. 15

    有没有一种方法可以使用Python从目录创建jar?

  16. 16

    有没有一种方法可以自动删除临时目录?

  17. 17

    有没有一种方法可以快速浏览目录中的多个pdf?

  18. 18

    有没有一种方法可以获取执行或编译的.java文件的文件路径?

  19. 19

    有没有一种方法可以获取子集中的所有文档

  20. 20

    有没有一种方法可以获取所有堆userptr的userstack

  21. 21

    当嵌入到网页中时,有没有一种方法可以隐藏SVG文件/ xml的内容?

  22. 22

    有没有一种方法,我可以从绑定的Windows主机到Linux容器安装点的文件?

  23. 23

    有没有一种方法可以将随机文件从源复制到目标?

  24. 24

    有没有一种方法可以累加我从.txt文件中检索到的整数

  25. 25

    有没有一种方法可以浅复制现有文件对象?

  26. 26

    有没有一种方法可以让文件大小只有FileDescriptor?

  27. 27

    有没有一种方法可以使用Google Drive API获取文件名?

  28. 28

    有没有一种方法可以将Dependabot的徽章生成到GitHub?

  29. 29

    React Navigation有没有一种方法可以从父组件中引用导航器?

热门标签

归档