パンダはすべての一意の列値に対して何かを行います

debugcn 投稿 Dev

ジョーディウィックス

パンダを使い始めたばかりなので、無知を許してください。

行と列の数が多いcsvファイルがあるとします。

ID, Name, Number, SomethingElse
1, John, 234234, "word"
2, Dave, 2342423, "word2"
3, John, 54365345, "word3"

Nameの一意の値のみを使用して新しいcsvを作成したいと思います。使ってます：

unique = df.Name.unique()

新しいDataFrameを取得するには？すべての一意の名前を使用しますが、この新しいDFを使用して各名前を検索し、その名前のすべての値を使用して新しいファイルを作成する方法を理解できません。

file1.csv
ID, Name, Number, SomethingElse
1, John, 234234, "word"
3, John, 54365345, "word3"

file2.csv
ID, Name, Number, SomethingElse
2, Dave, 234234, "word2"

通常、Python3ではセットを使用してからネストされたループを使用しますが、データフレームが実際に何であるかについての基本的な理解が不足していると思います。

ジェズリール

可能であれば、ファイル名をname値で変更するJohn.csvかDave.csv、DataFrame.groupbyオブジェクトごとにループしますDataFrame.to_csv。

for i, g in df.groupby('Name'):
    g.to_csv(f'{i}.csv', index=False)

小文字のファイル名の場合は、lower()次を追加します。

for i, g in df.groupby('Name'):
    g.to_csv(f'{i.lower()}.csv', index=False)

また、ソリューションはboolean indexingフィルタリングに使用できます。

for v in df.Name.unique():
    df[df['Name'] == v].to_csv(f'{v.lower()}.csv', index=False)

以下のためのソリューションfile1.csv、file2.csvとenumerate：

for j, (i, g) in enumerate(df.groupby('Name'), 1):
    g.to_csv(f'file{j}.csv', index=False)

または：

for j, v in enumerate(df.Name.unique(), 1):
    df[df['Name'] == v].to_csv(f'file{j}.csv', index=False)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

パンダは、一意の値に対応する別の列からのすべてのエントリで新しい列を作成します

分類Dev

パンダ：一意の値に基づいて、行の対応する列の値を取得します

分類Dev

パンダを使用して、特定の列から特定の一意の値に対して中央値、平均などのアクションを実行します

分類Dev

パンダの一意の値に従って列を並べ替える方法はありますか？

分類Dev

パンダは、一意の値に対して1つの列を反復処理し、別の列の値を取得します

分類Dev

別の列の一意性に基づいて、1つの列のパンダdfのすべての値を取得します

分類Dev

すべての行に対してMySQLの一意の列のみを連結するにはどうすればよいですか？

分類Dev

パンダは、既存の列の最初の一意の値に基づいて新しい列を作成します

分類Dev

パンダの操作：他の列のデータを1つの列に照合し、すべての行に一意に適用します

分類Dev

パンダの行ごとに一意の値を作成しますか？

分類Dev

特定の値に基づいてデータフレームをフィルタリングするだけでなく、パンダを使用して一意の識別子の他のすべての値を保持する方法はありますか？

分類Dev

パンダを使用して、他の2つの列の一意の値に対して列を合計するにはどうすればよいですか？

分類Dev

パンダを使用してグループ内の列の一意の値を印刷するにはどうすればよいですか？

分類Dev

パンダ：各列をループして、各列の一意の値を数えますか？

分類Dev

Excel 1つの列に一意の値が含まれ、別の列に1つの真の値が含まれている場合、それらの一意の値に対してすべての真の値を返します

分類Dev

一意の値と列の値に基づいて、データフレームから行をランダムに描画します

分類Dev

一意の行の値に対して特定の列を繰り返す

分類Dev

パンダ：データが欠落している場合でも、列の一意の値ごとに行を作成します

分類Dev

パンダの特定の値の1つの列に基づいて、1つの列に一意の値しかないDataFrameを変換する方法

分類Dev

パンダは列から一意の値を選択します

分類Dev

パンダは、一意の各列の値の最後に合計行を追加します

分類Dev

パンダ：1つの列でグループ化し、グループごとに他のすべての列の一意の値の数を表示するにはどうすればよいですか？

分類Dev

パンダは、対応する一意のID値からの平均値をプロットします

分類Dev

MySQLで、ある列の値の範囲の出現回数を、別の列のすべての一意の値に対してカウントするにはどうすればよいですか？

分類Dev

パンダデータフレーム内のすべての一意の値に基づいてデータをピボットします

分類Dev

この一意のIDは正確に何を表していますか？

分類Dev

列に特定の値を持つすべての行全体で一意の値を選択します

分類Dev