这样在Go中会更有效吗?

Askyj

我写了一段代码来说明grepGo中的标准命令,但是速度远远落后于它,有人可以给我带来什么进步吗?这是代码:

package main

import (
    "bufio"
    "fmt"
    "log"
    "os"
    "strings"
    "sync"
)

func parse_args() (file, pat string) {
    if len(os.Args) < 3 {
        log.Fatal("usage: gorep2 <file_name> <pattern>")
    }

    file = os.Args[1]
    pat = os.Args[2]
    return
}

func readFile(file string, to chan<- string) {
    f, err := os.Open(file)
    if err != nil {
        log.Fatal(err)
    }
    defer f.Close()

    freader := bufio.NewReader(f)
    for {
        line, er := freader.ReadBytes('\n')
        if er == nil {
            to <- string(line)
        } else {
            break
        }

    }
    close(to)
}

func grepLine(pat string, from <-chan string, result chan<- bool) {
    var wg sync.WaitGroup

    for line := range from {
        wg.Add(1)

        go func(l string) {
            defer wg.Done()
            if strings.Contains(l, pat) {
                result <- true
            }
        }(string(line))
    }

    wg.Wait()
    close(result)
}

func main() {
    file, pat := parse_args()
    text_chan := make(chan string, 10)
    result_chan := make(chan bool, 10)

    go readFile(file, text_chan)
    go grepLine(pat, text_chan, result_chan)

    var total uint = 0
    for r := range result_chan {
        if r == true {
            total += 1
        }
    }

    fmt.Printf("Total %d\n", total)
}

time围棋:

>>> time gogrep /var/log/task.log DEBUG 

Total 21089

real    0m0.156s
user    0m0.156s
sys 0m0.015s

timegrep

>>> time grep DEBUG /var/log/task.log | wc -l

21089

real    0m0.069s
user    0m0.046s
sys 0m0.064s
彼得

为了方便复制基准,我计算了莎士比亚中“和”文本的出现次数。

gogrep:

$ go build gogrep.go && time ./gogrep /home/peter/shakespeare.txt和 
总计21851
真正的0m0.613s
用户0m0.651s
sys 0m0.068s

grep:

$ time grep和/home/peter/shakespeare.txt | wc -l
21851
真正的0m0.108s
用户0m0.107s
sys 0m0.014s

petergrep:

$去建立petergrep.go && time ./petergrep /home/peter/shakespeare.txt和 
总计21851
真正的0m0.098s
用户0m0.092s
sys 0分0.008秒

petergrep用Go编写。它很快。

package main

import (
    "bufio"
    "bytes"
    "fmt"
    "log"
    "os"
)

func parse_args() (file, pat string) {
    if len(os.Args) < 3 {
        log.Fatal("usage: petergrep <file_name> <pattern>")
    }
    file = os.Args[1]
    pat = os.Args[2]
    return
}

func grepFile(file string, pat []byte) int64 {
    patCount := int64(0)
    f, err := os.Open(file)
    if err != nil {
        log.Fatal(err)
    }
    defer f.Close()
    scanner := bufio.NewScanner(f)
    for scanner.Scan() {
        if bytes.Contains(scanner.Bytes(), pat) {
            patCount++
        }
    }
    if err := scanner.Err(); err != nil {
        fmt.Fprintln(os.Stderr, err)
    }
    return patCount
}

func main() {
    file, pat := parse_args()
    total := grepFile(file, []byte(pat))
    fmt.Printf("Total %d\n", total)
}

数据:莎士比亚:p​​g100.txt

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

有更有效的方法吗?

来自分类Dev

我可以用_lodash替换angular.copy,这样会更有效吗?

来自分类Dev

更有效的.RData吗?

来自分类Dev

分块数组更有效吗?

来自分类Dev

更有效的书写方式吗?

来自分类Dev

更有效的布局可能吗?

来自分类Dev

Erlang:将类型规范添加到代码中会使透析器更有效吗?

来自分类Dev

MongoDB-这样有效吗?

来自分类Dev

MongoDB-这样有效吗?

来自分类Dev

使用Perl脚本填充硬盘驱动器-这样可以更有效地完成吗?

来自分类Dev

字节比布尔[8]更有效吗?

来自分类Dev

在MATLAB中更有效的对称方阵的方式吗?

来自分类Dev

for(auto && e:a)比for(auto&e:a)更有效吗?

来自分类Dev

这种多线程单例更有效吗?

来自分类Dev

我可以使用更有效的查询吗

来自分类Dev

改变端倪,工会比移位更有效吗?

来自分类Dev

++运算符比a = a + 1更有效吗?

来自分类Dev

使用setState或setProps对于Reactjs更有效吗?

来自分类Dev

这个python代码可以更有效吗?

来自分类Dev

知道如何使这段代码更有效吗?

来自分类Dev

使用向量对比使用向量对更有效吗?

来自分类Dev

用ccCircle画圆更有效吗?

来自分类Dev

求模数比And运算符更有效吗

来自分类Dev

数组公式或单个公式更有效吗?

来自分类Dev

哪个更有效?

来自分类Dev

使循环更有效

来自分类Dev

更有效的循环

来自分类Dev

使循环更有效

来自分类Dev

在jgrapht中修剪有向无环图的更有效方法吗?