我有一个数据文件,如下所示:
123456, 1623326
123456, 2346525
123457, 2435466
123458, 2564252
123456, 2435145
第一列是“ ID”-字符串变量。第二列对我来说无关紧要。我想结束
123456, 3
123457, 1
123458, 1
现在,第二列将计算原始文件中与第一列中的唯一“ ID”相对应的条目数。
使用bash或perl的任何解决方案都是很棒的。甚至Stata都会很好,但是我认为在Stata中很难做到这一点。如果有任何不清楚的地方,请告诉我。
cut -d',' -f1 in.txt | sort | uniq -c | awk '{print $2 ", " $1}'
给出:
123456, 3
123457, 1
123458, 1
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句