R个子集data.frame按组列以最大化行值

debugcn 发表于 Dev

阿罗埃卡

我有一个非常类似于此处描述的问题：

我试图安排一个研讨会，将召开五次会议。我有十天可以选择会议日期，每一天都有三个可能重叠的会议时间。因此，我将30列分为十组（天），每组三列（会议时间）。我需要根据以下条件选择5列（或会议日期-时间组合）：每天仅选择一个会议时间（每组一个列）；可以参加所有5次会议的受访者（行）数量已最大化。理想情况下，如果我放宽受访者必须参加所有5次会议，仅要求他们参加4次或3次等的标准，我也想知道最佳的栏选择如何变化。

为了进行简单的可视化，假设我想知道我应该选择哪两列（V1，V2和V3中的每列不超过一列），这样我就可以将不带零的行数最大化（即，行总和为2）。

V1A   V1B   V1C   V2A   V2B   V2C   V3A   V3B   V3C  
1     0     1     0     1     1     1     0     1   
1     1     0     0     1     1     0     1     1   
0     0     1     1     1     0     0     1     1   
1     1     1     1     0     0     1     0     0 
1     0     0     0     1     1     0     1     0 
0     1     1     0     1     1     0     0     0 
1     0     1     1     1     0     1     0     1

实际数据在这里：https : //drive.google.com/file/d/0B03dE9-8088aMklOUVhuV3gtRHc/view组是mon1 * tue1 * [mon2 * tue2 * [...] fri2 *。

如果不是需要从组中选择列的情况，则在上面的链接中建议的代码将解决我的问题。理想情况下，我还可以说出在较弱的条件下（行总和为5或4或3，等等），在较弱的条件下应该选择哪些列以使行数最大化。

非常感谢！

阿克伦

您可以rowSums用来获取大于或等于两个1的行的索引。（条件不是很清楚）

  lapply(split(names(df),sub('.$', '', names(df))), 
          function(x) which(rowSums(df[x])>=2))
  #$V1
  #[1] 1 2 4 6 7

  #$V2
  #[1] 1 2 3 5 6 7

  #$V3
  #[1] 1 2 3 7

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-10

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

R个子集data.frame按组列以最大化行值

R个子集data.frame按组列以最大化行值

data.frame列的子集，以最大化“完整”的观察结果

data.frame列的子集，以最大化“完整”的观察结果

列表中的R个子集列

按国家划分data.frame，并在每个子集上创建线性回归模型

取具有相同功能的data.frame的子集，然后从每个子集中选择一行

取具有相同功能的data.frame的子集，然后从每个子集中选择一行

组合分析以最大化 R 中的值

MICE-如何为每个子集而不是整个data.frame生成缺失值

根据一个或多个data.frame值创建一个子集函数

MICE-如何为每个子集而不是整个data.frame生成缺失值

提取在R条件下变量最大化的列

R个子集元素，如果每个元素指定列和行

仅从R data.frame的子集组合

在R中堆叠data.frame的子集

R：制作2个子集向量，以使值在索引方向上不同

R-来自数据帧中两个子集的新变量，行中的随机顺序

R：子集上的Data.table按值排除

在一行中按索引和名称将R data.frame子集

最大化以字母r结尾的行数

R中的优化（最大化）

最大化 R 中的目标函数

R中的约束最大化（优化）

识别data.frame的多个子集中的大多数可变行，并将此信息合并到最终的data.frame中

每个子集的子集列和计算操作

R当2列具有不同的值时为data.frame子集

data.table按组求和，并返回最大值的行

data.table：按组选择具有多个分组变量的最大值的行

在data.frame中按组查找最大值，并将其日期显示为年-月-日

R：具有最大值的子集/组数据帧？