变量在数据集中多次出现的概率

布赖恩

我正在处理一个数据集,其中有关于趋势YouTube视频的大约38.000个观察值。一个特定的视频可以有多个观察结果;意味着一个视频可能会出现多次趋势,或者趋势可能会超过一天。

以上是正确的,我们知道,但我试图弄清楚如何计算在此数据集中多次观看视频的概率。 P(X > 1)

请参阅下面我绘制的图像barplot(head(table(df$video_id)))在此处输入图片说明

我们可以看出,在这6个视频中,有5个具有不止一个观察值,等于83.33%的概率。如何在整个数据集中找出相同的结果?虽然我不一定要可视化它(这将是一个好处),但我只是好奇如何video_id在〜38.000个观测值中多次计算发生概率

以下是20个观察结果的示例:https : //pastebin.com/Tx9ebH2c

达卡森

您拥有所需的大部分:

tbl <- table(df$video_id)
p <- sum(tbl > 1)/length(tbl)
p
# [1] 0.5

对于您的样本数据集,一半的视频不止一次出现。表格的长度是不同视频的数量,因此,除以该数量即可得出不止一次观看视频的比例。您可以做一个简单的条形图,以显示观看多次视频的比例与观看一次视频的比例。

barplot(c(p, 1-p))

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

查找出现在数据集中不止一行的所有两个单词短语

来自分类Dev

从正态分布中选择的随机变量的出现概率

来自分类Dev

在数据集中获取行计数为零

来自分类Dev

数据集中出现的顺序因子级别

来自分类Dev

使用Shiny Inputs在数据集中创建新变量

来自分类Dev

在数字数据集中查找“异常值”

来自分类Dev

使用dplyr的rename()包括不在数据集中的变量名

来自分类Dev

使用字典在数据集中查找条目

来自分类Dev

AngularJS在数据集中显示最大重现属性

来自分类Dev

重复在数据集中有用吗?

来自分类Dev

在数据集中查找具有特定值的列的索引

来自分类Dev

SAS如何在数据步骤中在同一变量中多次连接字符串

来自分类Dev

将混合模型的结果保存在数据集中

来自分类Dev

LightGBM'在数据集中使用categorical_feature。警告?

来自分类Dev

如何只过滤出现在数据集中而不出现在先前数据集中的新数据?

来自分类Dev

根据条件在数据集中创建新行

来自分类Dev

在数据集中分割

来自分类Dev

尝试使用循环在数据集中查找唯一变量并使用sapply来应用特定函数

来自分类Dev

测试某些变量(不同版本)是否出现在数据中

来自分类Dev

在数据集中查找数据

来自分类Dev

使用Shiny Inputs在数据集中创建新变量

来自分类Dev

值在数据集中出现多少次的直方图

来自分类Dev

在数组行中多次出现时创建集合

来自分类Dev

检查第1列的值之前是否在数据集中出现了其他第2列的值

来自分类Dev

重塑数据集中的多个变量

来自分类Dev

在数据收集中解析 SNMP STRING

来自分类Dev

预测值不在数据集中

来自分类Dev

SQL 计数出现在数据集中,但变量值可以交换

来自分类Dev

在数据集中过滤“因子”类型的列?

Related 相关文章

  1. 1

    查找出现在数据集中不止一行的所有两个单词短语

  2. 2

    从正态分布中选择的随机变量的出现概率

  3. 3

    在数据集中获取行计数为零

  4. 4

    数据集中出现的顺序因子级别

  5. 5

    使用Shiny Inputs在数据集中创建新变量

  6. 6

    在数字数据集中查找“异常值”

  7. 7

    使用dplyr的rename()包括不在数据集中的变量名

  8. 8

    使用字典在数据集中查找条目

  9. 9

    AngularJS在数据集中显示最大重现属性

  10. 10

    重复在数据集中有用吗?

  11. 11

    在数据集中查找具有特定值的列的索引

  12. 12

    SAS如何在数据步骤中在同一变量中多次连接字符串

  13. 13

    将混合模型的结果保存在数据集中

  14. 14

    LightGBM'在数据集中使用categorical_feature。警告?

  15. 15

    如何只过滤出现在数据集中而不出现在先前数据集中的新数据?

  16. 16

    根据条件在数据集中创建新行

  17. 17

    在数据集中分割

  18. 18

    尝试使用循环在数据集中查找唯一变量并使用sapply来应用特定函数

  19. 19

    测试某些变量(不同版本)是否出现在数据中

  20. 20

    在数据集中查找数据

  21. 21

    使用Shiny Inputs在数据集中创建新变量

  22. 22

    值在数据集中出现多少次的直方图

  23. 23

    在数组行中多次出现时创建集合

  24. 24

    检查第1列的值之前是否在数据集中出现了其他第2列的值

  25. 25

    重塑数据集中的多个变量

  26. 26

    在数据收集中解析 SNMP STRING

  27. 27

    预测值不在数据集中

  28. 28

    SQL 计数出现在数据集中,但变量值可以交换

  29. 29

    在数据集中过滤“因子”类型的列?

热门标签

归档