如果其他数据框中没有该值，则熊猫从数据框中排除行

Gvaihir 发表于 Dev

格瓦希尔

Dataframe_1如果此行中第四列的值存在于的整个第一列的任何行中，我想从熊猫中查找行Dataframe_2。我需要将这些行复制到新表中。

编辑

在这里，我还包括数据框：

数据框_1：

           1       2               3  4
 0
 chr1  128611  128681  cuffs_1_128645  .
 chr1  186868  186933  cuffs_2_186901  .
 chr1  186978  187035  cuffs_3_187015  .
 chr1  187054  187122  cuffs_4_187082  .
 chr1  262712  262773  cuffs_5_262742  .

数据框_2：

                            1      2     3      4     5      6     7  8
 0
 cuffs_100001_101338862   1.24   3.11  1.86  11.19  5.59   8.08  0.62  0
 cuffs_100004_101354225   2.49   0.62  1.86   1.86  2.49   1.24  0.00  0
 cuffs_100045_101386584  14.92  14.92  3.11  10.57  5.59  15.54  0.62  0
 cuffs_100089_101719129   2.49   0.62  1.86   5.59  1.86   1.86  0.00  0
 cuffs_100111_101726996   6.84   0.00  3.73   3.11  6.84   2.49  0.62  0

这两个数据帧都是从.csv导入的，并且非常庞大，因此在这里我只放置了几行和几列。

这是我尝试的：

 import pandas as pd
 df1 = pd.DataFrame.from_csv(Dataframe_1, sep = '\t', index_col=list(range(0,1,2)), header = None)
 df2 = pd.DataFrame.from_csv(Dataframe_2, sep = '\t', index_col=list(range(0,1,2)), header = None)
 df1 = df1[df1[3] == df2[0]]
 df1.to_csv(fileout, sep = '\t', header = False)

当执行此操作时，我得到八（或大约）行响应，这些响应引用了pandas软件包文件，index.pyx而hashtable.pyx我不理解。

格瓦希尔

知道了！显然，没有经过测试的用于过滤的命令，无论是过滤df1 = df1[df1[3].isin(df2[0])]还是df1 = df1[df1[3] == df2[0]]识别出代表行索引的“ 0”列。出路是导入Dataframe_2而不是分配（0,1,2）而是（1,2,3）来分配列，这将导致df2的以下格式设置：

                          0      2     3      4     5      6     7    8    
 1
 1.24   cuffs_100001_101338862   3.11  1.86  11.19  5.59   8.08  0.62    0
 2.49   cuffs_100004_101354225   0.62  1.86   1.86  2.49   1.24  0.00    0
 14.92  cuffs_100045_101386584  14.92  3.11  10.57  5.59  15.54  0.62    0
 2.49   cuffs_100089_101719129   0.62  1.86   5.59  1.86   1.86  0.00    0
 6.84   cuffs_100111_101726996   0.00  3.73   3.11  6.84   2.49  0.62    0

其中“ 0”列不再是行的索引。然后我们可以申请df1 = df1[df1[3].isin(df2[0])]。注意：的应用程序df1 = df1[df1[3] == df2[0]]将引发错误消息Series lengths must match to compare

谢谢！

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-23

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如果其他数据框中没有该值，则熊猫从数据框中排除行

如果其他数据框中没有该值，则熊猫从数据框中排除行

熊猫-创建新列，该列的值取自同一数据框中的其他行

熊猫：避免从dict中排除某些值的数据框

基于列过滤熊猫数据框：如果值是该列，则保留所有行

如果其他条件在熊猫数据框中并提取列值

熊猫在具有数字约束的数据框中的两个行值之间添加其他值

如果熊猫数据框中的其他行存在，请删除它

从数据框中排除行，除非满足其他列条件

熊猫从其他数据框中复制值

熊猫用同一行中的其他列值替换数据框值

熊猫获取不在其他数据框中的行

有没有一种方法可以对熊猫数据框中的某些项目进行排名并排除其他项目？

熊猫数据框查找存在于其他列的所有可能值的行

如果值在列表中，则熊猫数据框中的行重复

使用其他数据框的值，根据列名称乘以熊猫数据框的行

将R数据框中的列表扩展到该数据框中的其他行？

根据其他数据框中的列值在熊猫数据框中创建列

有没有办法为其他数据框中的变量组合创建带有行的数据框？

比较其他熊猫数据框的每一行中的值

Python：如果其他值在数据框之间匹配，则对数据框中的值求和

与熊猫中的其他数据框合并时如何从未连接的数据框中获取行

如果值在列数据框中，则熊猫获取行

从其他数据框熊猫填充数据框中的列的NAN值

熊猫：如何使用其他数据框的列替换数据框中的值

根据数据框中的其他列更改熊猫数据框的列值

如果在熊猫数据框中没有，Multindex将添加零值

熊猫用其他数据框替换数据框中的行

如何从数据框中排除行（有条件）？

如何从数据框中排除特定的行？

如何仅提取纪元细节而将其他内容排除在熊猫数据框中？