有效地列出目录中包含很多条目的文件

达斯汀·奥普里亚(Dustin Oprea)

我需要递归地读取目录结构,但是一旦我读完每个目录的所有条目,就还需要执行其他步骤。因此,我需要编写自己的递归逻辑(并且不能使用简单的filepath.Walk例程)。但是,ioutil.ReadDirfilepath.Glob例程仅返回切片。如果我要突破ext4xfs的限制,并建立一个目录,文件的数量达到数十亿怎么办?我希望golang具有os.FileInfo在通道而不是排序的切片上返回未排序的一系列(甚至更好的原始字符串)的函数在这种情况下,我们如何有效地读取文件条目?

上面引用的所有函数似乎都依赖readdirnamesos / dir_unix.go,并且由于某种原因,它仅在看起来很容易生成gothread并将值推入通道的情况下才创建一个数组。这样做可能有合理的逻辑,但尚不清楚它是什么。我是Go的新手,所以我也很容易错过其他人显而易见的一些原则。

这是源代码,为方便起见:

func (f *File) readdirnames(n int) (names []string, err error) {
    // If this file has no dirinfo, create one.
    if f.dirinfo == nil {
        f.dirinfo = new(dirInfo)
        // The buffer must be at least a block long.
        f.dirinfo.buf = make([]byte, blockSize)
    }
    d := f.dirinfo

    size := n
    if size <= 0 {
        size = 100
        n = -1
    }

    names = make([]string, 0, size) // Empty with room to grow.
    for n != 0 {
        // Refill the buffer if necessary
        if d.bufp >= d.nbuf {
            d.bufp = 0
            var errno error
            d.nbuf, errno = fixCount(syscall.ReadDirent(f.fd, d.buf))
            if errno != nil {
                return names, NewSyscallError("readdirent", errno)
            }
            if d.nbuf <= 0 {
                break // EOF
            }
        }

        // Drain the buffer
        var nb, nc int
        nb, nc, names = syscall.ParseDirent(d.buf[d.bufp:d.nbuf], n, names)
        d.bufp += nb
        n -= nc
    }
    if n >= 0 && len(names) == 0 {
        return names, io.EOF
    }
    return names, nil
}
吉姆布

ioutil.ReadDirfilepath.Glob周围阅读目录条目只是方便的功能。

如果提供的参数> 0 ,则可以直接使用ReaddirorReaddirnames方法批量读取目录条目n

对于像读取目录项这样的基本操作,无需增加goroutine和通道的开销,也无需提供返回错误的替代方法。如果愿意,您始终可以使用自己的goroutine和通道模式包装批处理的调用。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

有效地从文件A中删除包含文件B中的字符串的行

来自分类Dev

如何有效地减少列表:其他条目中未包含的条目

来自分类Dev

如何有效地删除单个目录中的2,000,000个文件?

来自分类Dev

有效地从大.tgz中删除文件

来自分类Dev

有效地在Matlab中解析CSV文件

来自分类Dev

有效地遍历文件目录,同时最大程度地减少Python中的内存使用量

来自分类Dev

有效地将文件传输到两个目的地

来自分类Dev

如何有效地从Java中的LinkedHashMap中删除条目?

来自分类Dev

如何有效地将数据框中的条目映射到字典

来自分类Dev

仅在Perl中存在哈希条目时有效地获取它

来自分类Dev

如何有效地更改矩阵/嵌套列表中的条目?

来自分类Dev

仅在Perl中存在哈希条目时才有效地获取它

来自分类Dev

如何有效地创建数组 Python 中条目数的频率表

来自分类Dev

如何使用 csvhelper 有效地编写包含数千列的 csv 文件?

来自分类Dev

如何将所有目录有效地移动到同一文件夹中的单个目录中?

来自分类Dev

如何有效地合并Emacs中的两个目录?

来自分类Dev

如何有效地选择Spark中包含特定值的数据框列?

来自分类Dev

在iOS上有效地绘制带有很多点的图表

来自分类Dev

如何有效地索引文件?

来自分类Dev

C ++-有效地顺序读取文件

来自分类Dev

有效地写入日志文件

来自分类Dev

有效地合并文件块

来自分类Dev

C ++-有效地顺序读取文件

来自分类Dev

使用Play 2.3有效地提供文件

来自分类Dev

有效地搜索JSON文件

来自分类Dev

简单有效地连接CSV文件

来自分类Dev

有效地使用try()删除文件

来自分类Dev

有效地grep排序文件的间隔

来自分类Dev

有效地将许多行写入文件

Related 相关文章

热门标签

归档