将两个csv文件与python pandas比较,并使用产生的数据框创建第三个文件

里沙卜·in那(Rishabh Jain)

我有2个大型的csv文件(都有大约一百万行具有不同的列名,单个文件中大约有70列)。我想使用python pandas执行左连接(类似sql),并使用结果创建一个新的csv文件。

使用sql与以下查询可以实现相同的操作-

select opportunities.* , data_dump.OpportunityID
 from opportunities 
 left join data_dump on (opportunities.LeadIdentifier=data_dump.LeadId and opportunities.ProductSku=data_dump.ProductName)

我当时想做这样的事情,但这对于这么大的数据来说效率很低,

fetched_opportunities = pd.read_csv(path + "/data_dump.csv").fillna('')
data_obj = fetched_opportunities.to_dict(orient='records')
fetched_opportunities2 = pd.read_csv(path + "/opportunities.csv").fillna('')
data_obj2 = fetched_opportunities2.to_dict(orient='records')
for opportunity_detail2 in data_obj:
    for opportunity_detail1 in data_obj:
        if opportunity_detail2['LeadIdentifier'] == opportunity_detail1['LeadId'] & opportunity_detail2['ProductSku'] == opportunity_detail1['ProductName']:

瓦利德

尝试使用merge如下功能:

fetched_opportunities = pd.read_csv(path + "/data_dump.csv").fillna('')
fetched_opportunities2 = pd.read_csv(path + "/opportunities.csv").fillna('')

out=fetched_opportunities[["OpportunityID","LeadId","ProductName"]].merge(fetched_opportunities2,how='left',left_on=['LeadId','ProductName'],right_on=['LeadIdentifier','ProductSku']).drop(["LeadId","ProductName"],axis=1)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类常见问题

如何使用键值从两个对象创建第三个对象

来自分类Dev

比较两个csv文件中的列并将结果写入第三个

来自分类Dev

如何根据熊猫中的第三个数据框联接两个数据框?

来自分类Dev

您如何比较两个文件夹并将差异复制到第三个文件夹?

来自分类Dev

将两个文件与第三个文件的输入进行比较,并将最大计数写入第四个文件

来自分类Dev

使用两个输出列通过SELECT创建第三个输出列

来自分类Dev

如果第三个键为真,则比较mongodb文档的两个键

来自分类Dev

如何比较两个Excel文件并使用Python编写第三个文件?

来自分类Dev

比较两个列表,如果相等则替换第三个列表中的值

来自分类Dev

使用INNER JOIN将两个表合并为第三个表

来自分类Dev

通过比较两个字典的值来创建第三个字典

来自分类Dev

以第三个为x轴绘制两个数据框列

来自分类Dev

如何比较两个文件夹并将差异复制到第三个文件夹?

来自分类Dev

合并两个csv文件,以使用两个现有csv文件中的选定行生成第三个csv文件

来自分类Dev

如何将两个文件之间的差异结果合并到第三个文件?

来自分类Dev

逐行比较两个文件,然后将匹配项移至第三个文件

来自分类Dev

要检查两个文件iterativley的条目以及python中的第三个文件

来自分类Dev

比较两个工作表以创建第三个工作表

来自分类Dev

创建两个数组,然后在用作两个微调器uipickerview的数据的第三个数组中使用它们

来自分类Dev

将两个列表框中的项目组合到第三个列表框中

来自分类Dev

将两个文本文件合并为第三个文件并跟踪数据

来自分类Dev

如何将两个文件的内容串联起来以构成第三个文件?

来自分类Dev

比较两个文件夹并列出Windows中第三个文件夹中的差异

来自分类Dev

根据键值比较两个不同布局的文件并将输出提取到第三个文件

来自分类Dev

比较两个 Excel 工作簿并将匹配的数据复制到第三个工作簿

来自分类Dev

在 2 个数据帧之间的 Pandas 中查找以创建第三个数据帧

来自分类Dev

比较两个文件的重复项并将结果发送到第三个文件

来自分类Dev

将两个数组 php 与第三个数组进行比较

来自分类Dev

合并两个字典列表以在 python 中创建第三个

Related 相关文章

  1. 1

    如何使用键值从两个对象创建第三个对象

  2. 2

    比较两个csv文件中的列并将结果写入第三个

  3. 3

    如何根据熊猫中的第三个数据框联接两个数据框?

  4. 4

    您如何比较两个文件夹并将差异复制到第三个文件夹?

  5. 5

    将两个文件与第三个文件的输入进行比较,并将最大计数写入第四个文件

  6. 6

    使用两个输出列通过SELECT创建第三个输出列

  7. 7

    如果第三个键为真,则比较mongodb文档的两个键

  8. 8

    如何比较两个Excel文件并使用Python编写第三个文件?

  9. 9

    比较两个列表,如果相等则替换第三个列表中的值

  10. 10

    使用INNER JOIN将两个表合并为第三个表

  11. 11

    通过比较两个字典的值来创建第三个字典

  12. 12

    以第三个为x轴绘制两个数据框列

  13. 13

    如何比较两个文件夹并将差异复制到第三个文件夹?

  14. 14

    合并两个csv文件,以使用两个现有csv文件中的选定行生成第三个csv文件

  15. 15

    如何将两个文件之间的差异结果合并到第三个文件?

  16. 16

    逐行比较两个文件,然后将匹配项移至第三个文件

  17. 17

    要检查两个文件iterativley的条目以及python中的第三个文件

  18. 18

    比较两个工作表以创建第三个工作表

  19. 19

    创建两个数组,然后在用作两个微调器uipickerview的数据的第三个数组中使用它们

  20. 20

    将两个列表框中的项目组合到第三个列表框中

  21. 21

    将两个文本文件合并为第三个文件并跟踪数据

  22. 22

    如何将两个文件的内容串联起来以构成第三个文件?

  23. 23

    比较两个文件夹并列出Windows中第三个文件夹中的差异

  24. 24

    根据键值比较两个不同布局的文件并将输出提取到第三个文件

  25. 25

    比较两个 Excel 工作簿并将匹配的数据复制到第三个工作簿

  26. 26

    在 2 个数据帧之间的 Pandas 中查找以创建第三个数据帧

  27. 27

    比较两个文件的重复项并将结果发送到第三个文件

  28. 28

    将两个数组 php 与第三个数组进行比较

  29. 29

    合并两个字典列表以在 python 中创建第三个

热门标签

归档