想象以下非常简单的数据集:
Variable
A
B
B
C
D
D
D
E
F
F
F
我想要得到的是这些值出现频率的直方图。如果仅对数据运行hist(),则将获得每个值的计数,但是我真正想要的是:
+
+ +
+++
123
但是,您知道的不是ASCII艺术。主要是,它使数据集从可变的特定频率折叠到说“三个值出现一次,一个值出现两次,两个值出现三次”。
使用对的嵌套调用table
。这是使用来自的变量的示例iris
:
> table(iris$Sepal.Width)
2 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4 4.1 4.2 4.4
1 3 4 3 8 5 9 14 10 26 11 13 6 12 6 4 3 6 2 1 1 1 1
> table(table(iris$Sepal.Width))
1 2 3 4 5 6 8 9 10 11 12 13 14 26
5 1 3 2 1 3 1 1 1 1 1 1 1 1
调用table
一次可以告诉您每个值出现table
的频率,然后在该表上调用可以让您计算不同计数的频率。然后,您可以barplot
在第二张表中创建一个以可视化该结果:
barplot(table(table(iris$Sepal.Width)))
注意:通常hist
用于汇总连续变量(以指定数量或“箱”的大小),而barplot
用于显示计数。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句