搜索

搜索

从一组 x 项中，重复每个项 y 次，使得 y 服从正态分布

debugcn 发表于 Dev

6

哦哦

从一组 x 唯一项中，我需要将每个项重复 y 次，以便 y 遵循正态分布。

例如，如果项目数 n = 5，y_max = 50。如果我们计算排序列表中每个项目重复的次数，视觉效果将如下所示：

my_set=('a','b','c','d','e')
distribution = np.random.normal(len(my_set)/2, 1,len(my_set)).round().astype(int)
np.repeat(my_set, distribution)

我希望结果遵循与图表类似的趋势，但结果遵循增加或减少的趋势。

为了可读性，我将使用元组而不是重复每个项目 y 次。

预期结果应该是这样的：

[('a', 2), ('b', 4), ('c', 5), ('d', 3), ('e', 1)]

实际结果：

[('a', 5), ('b', 4), ('c', 3), ('d', 4), ('e', 3)]

搜狐

首先，让我们生成所需的结果。

my_set = ('a', 'b', 'c', 'd', 'e')
distribution = np.random.normal(len(my_set)/2, 1, 10000).round().astype(int)
result = [my_set[max(min(el, 4), 0)] for el in distribution]
np.unique(result, return_counts=True)
>>> (array(['a', 'b', 'c', 'd', 'e'], dtype='<U1'),
>>> array([ 234, 1377, 3421, 3374, 1594]))

这里我们从给定的分布中生成 10000 个随机值，并取相应的字母而不是每个数字。所以计数代表了我们正在寻找的东西：每个字母出现的次数通常是分布的。

代码中的核心问题是理解什么是分布或什么值是正态分布的。当我们调用 np.random.normal 时，它所做的只是生成一个正态分布的变量。根据正态分布的定义，它意味着某个数字 x 以一定的概率 p = 出现。从频率的角度来看，这意味着如果我们多次运行变量生成p，则试验总数的比例将为x。而这正是我们正在寻找的。

在您的代码中，您所做的是使出现次数本身呈正态分布的变量。这意味着每个字母将出现正态分布的n +- s次数s。所以它基本上是具有正态误差的正态分布。仔细阅读您的帖子，我认为这不是您要找的东西。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-24

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

中的R正态分布的3D图围绕一（X，Y）点

来自分类Dev

汇总数据表中多个列中的重复项，使得每个值仅列出一次

来自分类Dev

汇总数据表中多个列中的重复项，使得每个值仅列出一次

来自分类Dev

如何在 xy 平面中的给定 (x,y) 坐标内生成一组随机点？

来自分类Dev

查找未排序数组中是否有元素 (x,y,z) 使得 x + y = z

来自分类Dev

删除data.table列X中的某些重复项，但如果Y列符合条件，则保留重复项

来自分类Dev

x个唯一字符的Python排列，每个重复y次

来自分类Dev

给定在（X，Y，Z）坐标中定义的一组点，将Z值插值到任意（X，Y）

来自分类Dev

循环ggscatter函数，用于数据框列中x，y变量的唯一组合

来自分类Dev

熊猫DF和RE-找到匹配项Y。然后找到X的最后一次出现

来自分类Dev

使用日志记录过滤一组Either [x，y]

来自分类Dev

绘制 R 中一组 x 和 y 值的曲线（积分）下的面积

来自分类Dev

需要在 Pandas 中绘制直方图，使得 x 轴是分类的，y 轴是某些列的总和

来自分类Dev

在x首先超过y的组中过滤

来自分类Dev

找到最大 n 使得 x^n<=y 的最快算法

来自分类Dev

生成正态分布，Y箱中恰好有N个元素

来自分类Dev

如何在 Matlab 中的正态分布图上细化 y 轴？

来自分类Dev

找到三个索引x，y，z，使得M [x] + M [y] = N [z]

来自分类Dev

我如何在Matlab中从具有x，y和z坐标的一组点生成体素网格

来自分类Dev

JavaScript重复功能x次，持续y秒

来自分类Dev

重复请求X次或直到返回Y个项目

来自分类Dev

给定“ y”参数，如何重复字符串“ x”次

来自分类Dev

x || y与mapply（[R]中的function（x，y）x || y，x，y）

来自分类Dev

x || y与[[R]中的mapply（function（x，y）x || y，x，y）

来自分类Dev

如何从另一个逗号分隔列表中获取从 y 开始的 x 项的逗号分隔列表

来自分类Dev

如何仅对λy。（λx.λy.yx）yz应用一次beta减少？

来自分类Dev

MYSQL：一组中varchar y：m：d的平均值

来自分类Dev

给定一组具有x，y和z坐标且边界为0到1（含0）的点，请确定它们是否全部均匀分布（或接近）

来自分类Dev

在python中使用scipy.spatial.distance.cdist（X，Y）查找一组点之间的距离

Related 相关文章

文章

热门标签

归档