熊猫组合数据框

ph
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import pickle

java = pickle.load(open('JavaSafe.p','rb')) ##import 2d array
python = pickle.load(open('PythonSafe.p','rb')) ##import 2d array

javaFrame = pd.DataFrame(java,columns=['Town','Java Jobs'])
pythonFrame = pd.DataFrame(python,columns=['Town','Python Jobs'])
javaFrame = javaFrame.sort_values(by='Java Jobs',ascending=False)
pythonFrame = pythonFrame.sort_values(by='Python Jobs',ascending=False)
print(javaFrame,"\n",pythonFrame)

该代码包含以下内容:

                Town  Java Jobs
435          York,NY       3593
212       NewYork,NY       3585
584       Seattle,WA       2080
624       Chicago,IL       1920
301        Boston,MA       1571
...
79        Holland,MI          5
38      Manhattan,KS          5
497        Vernon,IL          5
30        Clayton,MO          5
90       Waukegan,IL          5

[653 rows x 2 columns] 

                 Town  Python Jobs
160       NewYork,NY         2949
11           York,NY         2938
349       Seattle,WA         1321
91        Chicago,IL         1312
167        Boston,MA         1117

383       Hanover,NH            5
209      Bulverde,TX            5
203     Salisbury,NC            5
67       Rockford,IL            5
256       Ventura,CA            5

[416 rows x 2 columns]

我想制作一个使用城镇名称作为索引并为每个java和python设置一列的新数据框。但是,某些城镇仅会使用其中一种语言的结果。

算了吧
import pandas as pd

javaFrame = pd.DataFrame({'Java Jobs': [3593, 3585, 2080, 1920, 1571, 5, 5, 5, 5, 5],
     'Town': ['York,NY', 'NewYork,NY', 'Seattle,WA', 'Chicago,IL', 'Boston,MA', 'Holland,MI', 'Manhattan,KS', 'Vernon,IL', 'Clayton,MO', 'Waukegan,IL']}, index=[435, 212, 584, 624, 301, 79, 38, 497, 30, 90])
pythonFrame = pd.DataFrame({'Python Jobs': [2949, 2938, 1321, 1312, 1117, 5, 5, 5, 5, 5],
     'Town': ['NewYork,NY', 'York,NY', 'Seattle,WA', 'Chicago,IL', 'Boston,MA', 'Hanover,NH', 'Bulverde,TX', 'Salisbury,NC', 'Rockford,IL', 'Ventura,CA']}, index=[160, 11, 349, 91, 167, 383, 209, 203, 67, 256])

result = pd.merge(javaFrame, pythonFrame, how='outer').set_index('Town')
#               Java Jobs  Python Jobs
# Town                                
# York,NY          3593.0       2938.0
# NewYork,NY       3585.0       2949.0
# Seattle,WA       2080.0       1321.0
# Chicago,IL       1920.0       1312.0
# Boston,MA        1571.0       1117.0
# Holland,MI          5.0          NaN
# Manhattan,KS        5.0          NaN
# Vernon,IL           5.0          NaN
# Clayton,MO          5.0          NaN
# Waukegan,IL         5.0          NaN
# Hanover,NH          NaN          5.0
# Bulverde,TX         NaN          5.0
# Salisbury,NC        NaN          5.0
# Rockford,IL         NaN          5.0
# Ventura,CA          NaN          5.0

pd.merge默认情况下,将在共享的所有列上加入两个DataFrame。在这种情况下,javaFrame并且pythonFrame仅共享Town的公共列。因此,默认情况下pd.merge会将Town上的两个DataFrames连接起来

how='outer导致pd.merge使用两个框架中的键并集换句话说,它会导致pd.merge返回行,其数据来自两种javaFramepythonFrame即使只有一个数据帧中包含的Town丢失的数据用NaNs填充

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何结合数据框和向量

来自分类Dev

熊猫:组合不同大小的数据框

来自分类Dev

通过数字组合熊猫数据框

来自分类Dev

大熊猫:难以将数据框转换为聚合数据框

来自分类Dev

从熊猫数据框中提取多列的组合

来自分类Dev

熊猫数据框中的值组合

来自分类Dev

熊猫根据ID组合2个数据框

来自分类Dev

如何基于熊猫数据框中的复杂组合创建指标

来自分类Dev

熊猫:转换数据框以显示原始数据框中是否存在值的组合

来自分类Dev

计算熊猫数据框中的匹配组合

来自分类Dev

使用键在熊猫中重新组合数据框。比遍历行更快的方法吗?

来自分类Dev

如何从文件读取文件路径并创建单个组合数据框?

来自分类Dev

熊猫PIVOT数据框并按级别组合列名称

来自分类Dev

如何在Python中将组合数据集转换为数据框

来自分类Dev

使用熊猫组合数据框中两行的不同部分

来自分类Dev

Rails中的组合数据标签属性

来自分类Dev

使用混合数据清洗或引用熊猫数据框

来自分类Dev

大熊猫,组合多个数据框

来自分类Dev

如何将系列和熊猫的数据框组合为一个数据框?

来自分类Dev

以所有可能的组合耦合数据

来自分类Dev

组合熊猫数据框中的行

来自分类Dev

需要帮助组合数据点

来自分类Dev

mongoose - 通过聚合组合数据

来自分类Dev

在熊猫列中组合混合数据类型

来自分类Dev

如何组合数据框中的字符串以列出和拆分列?

来自分类Dev

组合数据框中的文本元素并删除文本来自的行

来自分类Dev

具有组合数据和条件的数据框

来自分类Dev

使用 R 根据公共变量组合数据框中的行

来自分类Dev

如何对联合数据框进行分组以组合相同的行

Related 相关文章

热门标签

归档