私は通常のdfを持っています
A = pd.DataFrame([[1, 5, 2], [2, 4, 4], [3, 3, 1], [4, 2, 2], [5, 1, 4]],
columns=['A', 'B', 'C'], index=[1, 2, 3, 4, 5])
別の列の条件に基づいて列を作成したい場合は、このようなことを行い、期待どおりに機能します。
In [5]: A['D'] = A['C'] > 2
In [6]: A
Out[6]:
A B C D
1 1 5 2 False
2 2 4 4 True
3 3 3 1 False
4 4 2 2 False
5 5 1 4 True
ただし、2つの条件を使用して同じことをしたい場合...次のようになります。
A['D'] = A['C'] > 2 and A['B'] > 2 or A['D'] = A['C'] > 2 & A['B'] > 2
私は悪名高い
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
反復せずに解決するにはどうすればよいですか?2つの条件に基づいてこの新しい列を作成する目的は、次のタイプのgroupby関数を使用できるようにすることです。
A.groupby('D').apply(custom_fuction)
したがって、groupbyを使用してすべてを実行する方法があるかもしれませんが、その方法がわかりません。
ありがとう
要素ごとの論理積演算を実行する&
にはand
、ではなく、を使用します。
In [40]: A['D'] = (A['C'] > 2) & (A['B'] > 2)
In [41]: A
Out[41]:
A B C D
1 1 5 2 False
2 2 4 4 True
3 3 3 1 False
4 4 2 2 False
5 5 1 4 False
D
列の定義をスキップすることもできます。
In [42]: A.groupby((A['C'] > 2) & (A['B'] > 2))
Out[42]: <pandas.core.groupby.DataFrameGroupBy object at 0xab5b6ac>
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加