基于列中最频繁值的子集数据集

戴安娜01

我有一个如下所示的数据集:

head(data1)
  Data number PatientSID
1           1   24663193
2           3    7451277
3           6    7449440
4           8    7350669
5           9    7328477
6          11    7324432

                Condition                                                                                                                                                                                                                                                                                            
1 acute coronary syndrome
2          abdominal pain
3               epistaxis
4                leg pain
5       chronic back pain
6               back pain

我使用聚合函数来查看患者条件的频率:

x <- aggregate(data.frame(count = data1$Condition), list(value = data1$Condition), length)
head(x,10)
                       value count
1                          3   108
2         4 wheeler accident     1
3                  abdominal     1
4         abdominal aneurysm     1
5  abdominal aortic aneurysm     1
6         abdominal bloating     2
7           abdominal cramps     2
8       abdominal discomfort     6
9       abdominal distension     2
10      abdominal distention    21

现在基于上面的输出,我想将 data1 子集到一个只包含条件计数 >=10 的行的数据帧中。因此,例如,我的子集将包含条件为“3”和“腹胀”的所有行。我怎样才能做到这一点?

阿卡什87

您可以使用dplyr

x.sub <- x %>%
         filter(count >= 10)

data1.sub <- data1[data1$Condition %in% x.sub$value, ]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

基于最小值的子集数据

来自分类Dev

通过基于两列随机选择值来子集数据帧

来自分类Dev

子集数据集以保留最大的2个值

来自分类Dev

基于列中的数值的子集数据表

来自分类Dev

基于列中的数值的子集数据表

来自分类Dev

闪亮:基于用户列输入的动态子集数据

来自分类Dev

返回列中最频繁的值

来自分类Dev

基于字段的子集数据框

来自分类Dev

基于每组行数的子集数据帧

来自分类Dev

基于列名的部分匹配的子集数据

来自分类Dev

如何基于colMeans子集数据帧

来自分类Dev

R Shiny:基于checkboxgroupinput的子集数据

来自分类Dev

基于重复模式的子集数据帧

来自分类Dev

基于条件熊猫的子集数据帧

来自分类Dev

基于条件语句的子集数据

来自分类Dev

基于列表对象的子集数据框

来自分类Dev

基于列名的部分匹配的子集数据

来自分类Dev

基于缩放交互的子集数据框

来自分类Dev

基于 R 中条件的子集数据

来自分类Dev

以特定方式子集数据集

来自分类Dev

在for循环内子集数据集

来自分类Dev

查找数据框中最频繁/常用的值

来自分类Dev

Elixir中的最佳数据结构,用于基于值的频繁更新,项目删除和子集创建

来自分类Dev

基于至少5个连续值的向量序列的子集数据帧

来自分类Dev

基于R中列内因子级别的层次偏好的子集数据帧

来自分类Dev

数据库表中最频繁的列值 vb.net

来自分类Dev

R,dplyr的子集数据帧过滤列A的行值而不是列B的行NA

来自分类Dev

向量中基于条件的子集数据帧

来自分类Dev

向量中基于搜索模式的子集数据帧