「id」列を持つパンダのデータフレームがあります。「id」列にある値のサブセットである「new_ids」というリストもあります。
そのため、ID が新しいかどうかを示す列を pandas データフレームに追加したいと思います。最初にこの列を 0 に初期化しました。
df['new_id'] = 0
new_id リストをループして、pandas データフレームの「id」列で ID が見つかったら、この ID に属する行の「new_id」値を 1 に変更します。したがって、後で、新しい ID はすべて「new_id」列に 1 が割り当てられ、古い ID はすべて 0 のままになります。
index = df.index.values
for x in index:
if new_ids in df.id:
df.new_id[x] = '1'
x = x + 1
else:
x = x + 1
これはどういうわけか機能せず、多くのエラーが発生しています。私が間違っていることは何ですか?どうもありがとう!
実際には、DataFrame で手動で反復する必要はありません。パンダがあなたに代わって作業を行います。組み込みメソッドを使用して作業を行うのは非常に簡単で簡単です。
ここにいくつかのサンプル コードがあります。
import pandas as pd
sample = [['a','b','c'],[1,2,3],[4,5,6],['e','f','g']]
df = pd.DataFrame(sample, columns = ['name', 'ids', 'value'])
new_ids = ['b',5]
df['new_id'] = df['ids'].isin(new_ids)
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加