我在将直方图绘制为pdf时遇到麻烦
我希望所有片段的总和等于一个的面积,以便在数据集中进行比较更加容易。出于某种原因,无论何时指定中断(默认值为4或任何可怕的值),它都不再希望将bin绘制为概率,而是将bin绘制为频率计数。
hist(data[,1], freq = FALSE, xlim = c(-1,1), breaks = 800)
我应该将此行更改为什么?我需要概率分布和大量垃圾箱。(我有600万个数据点)
这在R帮助中,但是我不知道如何覆盖它:
逻辑 如果为TRUE,则直方图图形表示频率,即结果的计数分量;如果为FALSE,则绘制概率密度,成分密度(以便直方图的总面积为1)。当且仅当中断等距(且未指定概率)时,默认值为TRUE。
谢谢
编辑:详细信息
嗯,所以我的情节超过了1,如果有可能的话,这很令人困惑。我现在看到它与纸槽宽度有何关系。我或多或少希望使每个垃圾箱都值1分,同时仍然有很多垃圾箱。换句话说,除非箱高不直接位于1.0且所有其他箱均为0.0,否则箱高度不应高于1.0。就目前情况而言,我有一个垃圾桶,大约15.0
编辑:通过bin @Dwin中的%points设置高度:那么如何绘制概率?我意识到由于x轴上的单位,取积分仍然会给我1.0,但这不是我想要的。假设我有100分,其中5分落入第一个垃圾箱,那么该垃圾箱的高度应为0.05。这就是我要的。我做错了吗,还有另一种方法吗?
我知道我有几分。有没有办法将频率直方图中的每个bin计数除以该数字?
要回答绘制概率而不是密度的请求:
h <- hist(vec, breaks = 100, plot=FALSE)
h$counts=h$counts/sum(h$counts)
plot(h)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句