如何使用R中的泊松分布计算每小时到达率？

debugcn 发表于 Dev

魔法

我有一个包含66K行和4列的数据框，即客户ID，客户签到时间，客户签到时间和客户签出时间。

First 6 rows of the data:
cust_ID  cust_checkin_time      cust_checkout_time        checkin hour
12345    2019-01-01 07:02:50    2019-01-01 07:23:22        07AM_08AM
65789    2019-01-01 07:22:15    2019-01-01 07:26:02        07AM_08AM
90876    2019-01-01 07:25:21    2019-01-01 07:35:27        07AM_08AM
34567    2019-01-01 07:27:22    2019-01-01 07:38:56        07AM_08AM
36754    2019-01-01 07:44:41    2019-01-01 07:55:20        07AM_08AM
59876    2019-01-01 07:45:10    2019-01-01 07:58:42        07AM_08AM

我想知道每小时的到达率以使用泊松分布来预测等待时间。

我无法计算lambda，即每小时到达率。如何使用泊松分布或任何其他方法来计算该值。

请帮我解决这个问题。我已经花了将近一个星期的时间搜索Google，但是我没有得到满意的答复。

马丁·加尔

首先：这不是一个堆栈溢出问题。

假设您的客户在早上7点到晚上7点之间到达，即12个小时。
每小时数客户：

check-in hour   num_customer
 7 am -  8 am      10
 8 am -  9 am       7
10 am - 11 am      11
     ...
 6 pm -  7 pm       6

lambda通过汇总客户（10 + 7 + 11 + ... + 6）得出估算值，然后将其除以观察次数（入住时间，即12）。

使用dplyr：

data %>%
  count(checkin_hour) %>%
  summarise(lamba=sum(n)/n())

提供所需的输出。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

Pyspark，如何使用udf计算泊松分布？

来自分类Dev

如何在 Python 中实现这个 R 泊松分布？

来自分类Dev

使用R生成泊松分布

来自分类Dev

如何使Seaborn符合泊松分布？

来自分类Dev

Java中的泊松分布（正确吗？）

来自分类Dev

在C ++中实现泊松分布

来自分类Dev

Python中的双变量泊松分布

来自分类Dev

递归和，使用泊松分布

来自分类Dev

递归和，使用泊松分布

来自分类Dev

R中的泊松表

来自分类Dev

拟合泊松分布

来自分类Dev

如何在R中绘制泊松密度曲线？

来自分类Dev

如何从两个分布的总和中采样：二项式和泊松

来自分类Dev

如何使用 python 或其库拟合数据的泊松分布

来自分类Dev

R：在数据直方图上覆盖泊松分布

来自分类Dev

如何用泊松分布估计[并绘制]最大似然？

来自分类Dev

在Matlab中以所需的支持截断泊松分布

来自分类Dev

如何估计R中的泊松分布样本的Lambda，并以此为基础得出估计量密度函数的核估计？

来自分类Dev

如何计算R中时间码的每小时元素数

来自分类Dev

如何使用R中的插入符号包训练带有偏移项的glmnet模型（泊松族）？

来自分类Dev

如何计算scipy中的泊松随机变量概率？

来自分类Dev

使泊松分布适合正态分布

来自分类Dev

如何从Julia中拟合的GLM模型对象中提取数据分布类型（例如，泊松，二项式）？

来自分类Dev

如何从Julia中拟合的GLM模型对象中提取数据分布类型（例如，泊松，二项式）？

来自分类Dev

代理根据泊松过程到达

来自分类Dev

每小时如何计算请求数？

来自分类Dev

如何计算每小时的“停机时间”

来自分类Dev

在泊松分布python中找到概率

来自分类Dev

具有多个x的泊松分布

Related 相关文章

文章