搜索

搜索

删除包含熊猫数据框同一列中的值的子字符串的行的最快方法

debugcn 发表于 Dev

25

阿米尔·马苏德

我正在尝试编写一些有效的代码，以删除熊猫数据框的行，其中特定列中的值是同一列中其他值（至少一个值的子集）的子字符串。例如，考虑B以下输入数据框中的列：

|   | A  | B          |
|---|----|------------|
| 0 | 22 | ab         |
| 1 | 33 | abc        |
| 2 | 44 | abcd       |
| 3 | 55 | a          |
| 4 | 66 | john       |
| 5 | 77 | john Doe   |
| 6 | 88 | jo         |
| 7 | 99 | john hi Doe|

输出数据框：

|   | A  | B          |
|---|----|------------|
| 2 | 44 | abcd       |
| 5 | 77 | john Doe   |
| 7 | 99 | john hi Doe|

行0，1和3已被删除，因为其所有值的柱B（ab，abc，和a）是在该列中（即其它值的子串abcd）。第4行和第6行也是如此。

戴维·埃里克森

您可以使用一些列表推导来检查行字符串是否在数据框的其他行中：

m = df['B'].apply(lambda x: any([x for y in df['B'] if x != y if x in y]))
df = df[~m]
df
Out[1]: 
    A            B
2  44         abcd
5  77     john Doe
7  99  john hi Doe

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

如果一列的字符串包含熊猫数据框中另一列的单词，如何删除整行

来自分类Dev

熊猫数据框检查列是否包含另一列中存在的字符串

来自分类Dev

为熊猫数据框的每一行替换一列中的字符串

来自分类常见问题

如何从熊猫数据框中删除包含特定列中特定字符串的行？

来自分类Dev

根据其中一列中的子字符串删除数据帧的行

来自分类Dev

修改熊猫数据框中的一列，选择一个子字符串

来自分类Dev

如何使用数据框和熊猫检查列中的字符串是否是另一列中的子字符串

来自分类Dev

熊猫迭代从另一在一列行和删除字符串值

来自分类Dev

熊猫-检查列中的值是否是同一列中另一个值的子字符串

来自分类Dev

如何检查pandas数据框列中的子字符串是否存在于同一数据框中另一列的子字符串中？

来自分类Dev

如何从熊猫数据框中的列中删除字符串值

来自分类Dev

在python 3.4.1中删除具有字符串值的熊猫数据框的行

来自分类Dev

如何在熊猫数据框中按字符串值的条件删除行？

来自分类Dev

根据另一列中的字符串片段选择熊猫数据框列中的数据

来自分类Dev

如何在同一Pandas数据框中为另一列的唯一字符串值分配1000、1000 + 1

来自分类Dev

熊猫中的数据清理：如果特定字符串包含在另一列中，则将其替换为空值

来自分类Dev

Python：删除列表中至少由同一列表中其他一个字符串包含的字符串

来自分类Dev

R 在比较数据框中的字符串值后向数据框中添加一列

来自分类Dev

如何更新字符串的熊猫数据框列中的子字符串

来自分类Dev

从表中获取与一列中的值匹配并且在另一列中以逗号分隔的字符串存在子字符串的行

来自分类Dev

无法解析 modin 数据框中的一列 json 字符串（适用于熊猫）

来自分类Dev

替换系列熊猫同一列中的字符串

来自分类Dev

如何在数据框列中删除字符串的子字符串？

来自分类Dev

替换在熊猫的整个数据框中包含子字符串的整个字符串

来自分类Dev

使用其他列的索引值在pandas数据框中的一列中进行字符串索引

来自分类Dev

如何从同一数据框中查找另一列中包含唯一值的列值？

来自分类Dev

删除熊猫数据框中所有元素的最佳方法是什么？其中一列中的值在另一列中存在多次。

来自分类Dev

Python Pandas - 查找同一列中的元素（子字符串）

来自分类Dev

如何合并一列列表，提取唯一的字符串值，放入数据框

Related 相关文章

文章

热门标签

归档