从一组 x 项中,重复每个项 y 次,使得 y 服从正态分布

哦哦

从一组 x 唯一项中,我需要将每个项重复 y 次,以便 y 遵循正态分布。

例如,如果项目数 n = 5,y_max = 50。如果我们计算排序列表中每个项目重复的次数,视觉效果将如下所示:

在此处输入图片说明

my_set=('a','b','c','d','e')
distribution = np.random.normal(len(my_set)/2, 1,len(my_set)).round().astype(int)
np.repeat(my_set, distribution)

我希望结果遵循与图表类似的趋势,但结果遵循增加或减少的趋势。

为了可读性,我将使用元组而不是重复每个项目 y 次。

预期结果应该是这样的:

[('a', 2), ('b', 4), ('c', 5), ('d', 3), ('e', 1)]

实际结果 :

[('a', 5), ('b', 4), ('c', 3), ('d', 4), ('e', 3)]
搜狐

首先,让我们生成所需的结果。

my_set = ('a', 'b', 'c', 'd', 'e')
distribution = np.random.normal(len(my_set)/2, 1, 10000).round().astype(int)
result = [my_set[max(min(el, 4), 0)] for el in distribution]
np.unique(result, return_counts=True)
>>> (array(['a', 'b', 'c', 'd', 'e'], dtype='<U1'),
>>> array([ 234, 1377, 3421, 3374, 1594]))

这里我们从给定的分布中生成 10000 个随机值,并取相应的字母而不是每个数字。所以计数代表了我们正在寻找的东西:每个字母出现的次数通常是分布的。

代码中的核心问题是理解什么是分布或什么值是正态分布的。当我们调用 np.random.normal 时,它所做的只是生成一个正态分布的变量。根据正态分布的定义,它意味着某个数字 x 以一定的概率 p = 出现pdf正常从频率的角度来看,这意味着如果我们多次运行变量生成p,则试验总数的比例将为x而这正是我们正在寻找的。

在您的代码中,您所做的是使出现次数本身呈正态分布的变量。这意味着每个字母将出现正态分布的n +- s次数s所以它基本上是具有正态误差的正态分布。仔细阅读您的帖子,我认为这不是您要找的东西。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

中的R正态分布的3D图围绕一(X,Y)点

来自分类Dev

汇总数据表中多个列中的重复项,使得每个值仅列出一次

来自分类Dev

汇总数据表中多个列中的重复项,使得每个值仅列出一次

来自分类Dev

如何在 xy 平面中的给定 (x,y) 坐标内生成一组随机点?

来自分类Dev

查找未排序数组中是否有元素 (x,y,z) 使得 x + y = z

来自分类Dev

删除data.table列X中的某些重复项,但如果Y列符合条件,则保留重复项

来自分类Dev

x个唯一字符的Python排列,每个重复y次

来自分类Dev

给定在(X,Y,Z)坐标中定义的一组点,将Z值插值到任意(X,Y)

来自分类Dev

循环ggscatter函数,用于数据框列中x,y变量的唯一组合

来自分类Dev

熊猫DF和RE-找到匹配项Y。然后找到X的最后一次出现

来自分类Dev

使用日志记录过滤一组Either [x,y]

来自分类Dev

绘制 R 中一组 x 和 y 值的曲线(积分)下的面积

来自分类Dev

需要在 Pandas 中绘制直方图,使得 x 轴是分类的,y 轴是某些列的总和

来自分类Dev

在x首先超过y的组中过滤

来自分类Dev

找到最大 n 使得 x^n<=y 的最快算法

来自分类Dev

生成正态分布,Y箱中恰好有N个元素

来自分类Dev

如何在 Matlab 中的正态分布图上细化 y 轴?

来自分类Dev

找到三个索引x,y,z,使得M [x] + M [y] = N [z]

来自分类Dev

我如何在Matlab中从具有x,y和z坐标的一组点生成体素网格

来自分类Dev

JavaScript重复功能x次,持续y秒

来自分类Dev

重复请求X次或直到返回Y个项目

来自分类Dev

给定“ y”参数,如何重复字符串“ x”次

来自分类Dev

x || y与mapply([R]中的function(x,y)x || y,x,y)

来自分类Dev

x || y与[[R]中的mapply(function(x,y)x || y,x,y)

来自分类Dev

如何从另一个逗号分隔列表中获取从 y 开始的 x 项的逗号分隔列表

来自分类Dev

如何仅对λy。(λx.λy.yx)yz应用一次beta减少?

来自分类Dev

MYSQL:一组中varchar y:m:d的平均值

来自分类Dev

给定一组具有x,y和z坐标且边界为0到1(含0)的点,请确定它们是否全部均匀分布(或接近)

来自分类Dev

在python中使用scipy.spatial.distance.cdist(X,Y)查找一组点之间的距离

Related 相关文章

  1. 1

    中的R正态分布的3D图围绕一(X,Y)点

  2. 2

    汇总数据表中多个列中的重复项,使得每个值仅列出一次

  3. 3

    汇总数据表中多个列中的重复项,使得每个值仅列出一次

  4. 4

    如何在 xy 平面中的给定 (x,y) 坐标内生成一组随机点?

  5. 5

    查找未排序数组中是否有元素 (x,y,z) 使得 x + y = z

  6. 6

    删除data.table列X中的某些重复项,但如果Y列符合条件,则保留重复项

  7. 7

    x个唯一字符的Python排列,每个重复y次

  8. 8

    给定在(X,Y,Z)坐标中定义的一组点,将Z值插值到任意(X,Y)

  9. 9

    循环ggscatter函数,用于数据框列中x,y变量的唯一组合

  10. 10

    熊猫DF和RE-找到匹配项Y。然后找到X的最后一次出现

  11. 11

    使用日志记录过滤一组Either [x,y]

  12. 12

    绘制 R 中一组 x 和 y 值的曲线(积分)下的面积

  13. 13

    需要在 Pandas 中绘制直方图,使得 x 轴是分类的,y 轴是某些列的总和

  14. 14

    在x首先超过y的组中过滤

  15. 15

    找到最大 n 使得 x^n<=y 的最快算法

  16. 16

    生成正态分布,Y箱中恰好有N个元素

  17. 17

    如何在 Matlab 中的正态分布图上细化 y 轴?

  18. 18

    找到三个索引x,y,z,使得M [x] + M [y] = N [z]

  19. 19

    我如何在Matlab中从具有x,y和z坐标的一组点生成体素网格

  20. 20

    JavaScript重复功能x次,持续y秒

  21. 21

    重复请求X次或直到返回Y个项目

  22. 22

    给定“ y”参数,如何重复字符串“ x”次

  23. 23

    x || y与mapply([R]中的function(x,y)x || y,x,y)

  24. 24

    x || y与[[R]中的mapply(function(x,y)x || y,x,y)

  25. 25

    如何从另一个逗号分隔列表中获取从 y 开始的 x 项的逗号分隔列表

  26. 26

    如何仅对λy。(λx.λy.yx)yz应用一次beta减少?

  27. 27

    MYSQL:一组中varchar y:m:d的平均值

  28. 28

    给定一组具有x,y和z坐标且边界为0到1(含0)的点,请确定它们是否全部均匀分布(或接近)

  29. 29

    在python中使用scipy.spatial.distance.cdist(X,Y)查找一组点之间的距离

热门标签

归档