awk计算出现次数，然后分成两个文件

debugcn 发表于 Dev

VNA

要基于$ 2字段计算出现次数，然后将输入文件分成两个输出文件，如果$ 2字段出现次数超过3次，则将这些行重新定向到OpFile11.txt，否则将其重定向到OpFile22.txt

Input.csv

Des1,Location,Decs2
aaa,a123,xxx
bbb,b789,yyy
xxx,a123,aaa
aaa,a123,xxx
bbb,b789,yyy
ccc,c567,zzz
xxx,a123,aaa
ddd,d456,ddd

OpFile11.txt

aaa,a123,xxx
xxx,a123,aaa
aaa,a123,xxx
xxx,a123,aaa

OpFile22.txt

bbb,b789,yyy
bbb,b789,yyy
ccc,c567,zzz
ddd,d456,ddd

步骤＃1：计算发生次数：

awk -F, '{key=$2;++a[key]} END {for(i in a) print i","a[i]}' Input.csv 

d456,1
b789,2
c567,1
a123,4

步骤＃2：将输入文件分为两部分：

awk ' BEGIN {FS = OFS = ","} FNR==NR {a[$1]=$0;next} ($2 in a) { print $0 }' OccurGR3.csv Input.csv > OpFile11.txt
awk ' BEGIN {FS = OFS = ","} FNR==NR {a[$1]=$0;next} !($2 in a) { print $0 }' OccurGR3.csv Input.csv > OpFile22.txt

其中OccurGR3.csv

a123,4

请建议避免三步，寻找您的建议！

埃德·莫顿

awk -F, '
NR==FNR { cnt[$2]++; next }
{ print > ( "OpFile" (cnt[$2]<3?22:11) ".txt" ) }
' Input.csv Input.csv

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-10

我来说两句

0条评论

登录后参与评论

来自分类Dev

比较两个文本文件并计算出现次数

来自分类Dev

将两个列合并到一个DataFrame中，并使用PySpark计算出现次数

来自分类Dev

计算出现次数

来自分类Dev

计算出现次数和未出现的出现次数

来自分类Dev

两个NSDate的计算出的差是错误的-固定的

来自分类Dev

Javascript：在数组中搜索字符串，然后计算出现次数

来自分类Dev

在特定行之后读取表格，并使用awk计算出现次数

来自分类Dev

在python中编写一个函数来计算出现的次数

来自分类Dev

SQL：如何基于文件扩展名计算出现次数

来自分类Dev

匹配单词列表中的单词并计算出现次数

来自分类Dev

选择不同的值，并计算出现次数

来自分类Dev

用数组计算出现次数-Java

来自分类Dev

比较字符串并计算出现次数

来自分类Dev

匹配单词列表中的单词并计算出现次数

来自分类Dev

根据多个条件熊猫计算出现次数？

来自分类Dev

在表中查找值并计算出现次数

来自分类Dev

转置数据集并计算出现次数

来自分类Dev

awk计算出现次数并输出计数，并输出已计数的最后一次出现的完整记录

来自分类Dev

从文件中找出字符“a”，然后计算出现该字符的行数

来自分类Dev

Oracle：是否可以修剪字符串并计算出现次数，然后插入到新表中？

来自分类Dev

c ++如何从文本文件中将一行分成两行，然后分别存储到两个不同的数组中？

来自分类Dev

如何创建一个条形图来计算出现逗号分隔值的次数？

来自分类Dev

计算出现2个产品的订单

来自分类Dev

CSV文件中的计算出现随机数

来自分类Dev

使用Python计算出现在列表中的单词的出现次数

来自分类Dev

计算两个列案例的出现次数

来自分类Dev

如何用JavaScript中的两个日期计算出几天，几个月和几年的差异？

来自分类Dev

从两个单独的列表中提取每一行以计算出余弦相似度

来自分类Dev

如何在C＃中两个日期之间的时区中计算出经过的时间？

Related 相关文章

文章