搜索

搜索

计算熊猫数据框中包含n个值的行数

debugcn 发表于 Dev

31

安德烈斯·布斯塔曼特（Andres Bustamante）

我正在使用一个表格，该表格的列中包含对患者执行的操作，每一行代表一个患者。我需要做的是计算有多少患者接受了相同的程序组合。即，在每一行中都显示过程[A，B]或[A，B，Z]。顺序无关紧要。

因此，假设有此示例表，我尝试通过以下方式使用.isin（）方法：

d = {'col1': ['A', 'A', 'B',], 'col2': ['B', 'D', 'C'], 'col3': ['C', '','X',]}
df = pd.DataFrame(data=d)
print(df)
  col1 col2 col3
0    A    B    C
1    A    D     
2    B    C    X

我想获取给定两个过程，每个过程执行了多少次的列表：

dx1 = ['A', 'B']
df[df.isin(dx1).any(1)].apply(pd.value_counts).sum(axis=1).sort_values(ascending=False)

但是我得到了给定每个过程分别执行并加在一起的次数的列表（而不是“ and”将“ or”作为条件）

C    2.0
H    1.0
D    1.0
A    1.0
     1.0
dtype: float64

我需要为您提供执行A和B以外的过程的次数的列表，在这种情况下，应为：

C    1.0
dtype: float64

非常感谢您的提前估算。

斯克里迪

由于您不关心订单，因此集合应该可以解决您的问题：

d = {'col1': ['A', 'A', 'B',], 'col2': ['B', 'D', 'C'], 'col3': ['C', '','X',]}
df = pd.DataFrame(data=d)
dx1 = ['A', 'B']
df["procedures"] = df.apply(lambda x: [x.col1, x.col2, x.col3], axis=1)
df["contains_dx1"] = df.procedures.apply(lambda x: set(dx1).issubset(set(x)))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

计算熊猫数据框中的不同单词

来自分类Dev

熊猫：计算数据框中的唯一值

来自分类Dev

计算分组熊猫数据框中的总和

来自分类Dev

通过熊猫数据框按熊猫ID中的两个日期之间的行数进行计数

来自分类Dev

计算熊猫数据框中的单个单词

来自分类Dev

检查熊猫的数据框列中是否包含某些值

来自分类Dev

计算熊猫数据框中的年数

来自分类Dev

熊猫：如何检查熊猫数据框是否包含特定值？

来自分类Dev

计算熊猫数据框中特定值的数量

来自分类Dev

如何在单行数据框中获取与n个最大值相对应的列？

来自分类Dev

如何在熊猫数据框中按值组找到n个最大值的总和？

来自分类Dev

根据匹配的行数据在熊猫中创建新的数据框

来自分类Dev

从熊猫的数据框中仅提取包含“真”值的列

来自分类Dev

如何计算熊猫数据框中每组的行数并将其添加到原始数据

来自分类Dev

计算直到第一个值出现在熊猫数据框中的天数

来自分类Dev

如何递增计算熊猫数据框中的每个不同值

来自分类Dev

计算熊猫数据框中的不同值

来自分类Dev

如何计算数据框中同一列中特定值之后的行数

来自分类Dev

熊猫：在一个数据框中交换特定的列值，并计算其加权平均值

来自分类Dev

每个列值的行数相等的拆分熊猫数据框

来自分类Dev

在数据框熊猫中编辑行数据

来自分类Dev

从另一个数据框中更新熊猫数据框中的特定值

来自分类Dev

计算熊猫数据中每组的行数

来自分类Dev

计算熊猫数据框中的路径数据

来自分类Dev

通过熊猫数据框计算两个日期之间按ID排列的行数

来自分类Dev

熊猫：如何检查熊猫数据框是否包含特定值？

来自分类Dev

在python中过滤并计算数据框的长度，该数据框包含不同列中的值

来自分类Dev

如何计算熊猫数据框中的值

来自分类Dev

使用 lambda 计算熊猫数据框中的值

Related 相关文章

文章

热门标签

归档