我有一个函数,它接受一个输入并返回两个值的列表
def my_func(x):
return [x+1, x+2]
说我有一个简单的数据框
df = pd.DataFrame({'x':[1,2,3,4,5]})
我想将my_func应用于列“ x”的每个值,然后将返回值分别保存在列“ y”和列“ z”中,如下所示:
(df['y'], df['z']) = df.apply(lambda row: my_func(row.x), axis = 1)
显然,这是行不通的。
最好的方法是什么?
编辑:如下@Andy Hayden指出的,在这种情况下,我可以简单地使用
df['y'], df['z'] = myfunc(df.x)
那是因为myfunc
在这里做一个非常简单的向量计算。如果更复杂怎么办?
dict = {1:'a', 2:'b', 3:'c', 4:'d', 5:'e', 6:'f'}
def my_func(x):
return [dict[x], dict[x+1]]
所以在这里,dict[x]
不能再处理整个系列了,我想我必须使用apply
?然后再次,如何将结果放入数据框的两个单独的列中
我认为您不需要在这里申请:
In [11]: df["y"], df["z"] = my_func(df.x)
In [12]: df
Out[12]:
x y z
0 1 2 3
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句