元のデータフレームの列番号に基づいて複数のデータフレームを作成します

debugcn 投稿 Dev

JoãoFernandes

私はかなり長い間検索しましたが、同様の質問は見つかりませんでした。もしあれば教えてください！

現在、1つのデータフレームをn個のデータフレームに分割しようとしています。nは元のデータフレームの列数と同じです。結果として得られるすべての新しいデータフレームは、常に元のデータフレームの最初の列を保持する必要があります。たとえば、さらにアクセスするために、すべてのトゲッターをリストに追加します。

私の意図を視覚化するために、ここに簡単な例を示します。

 >> original df

 GeneID   A      B      C      D      E
   1     0.3    0.2    0.6    0.4    0.8
   2     0.5    0.3    0.1    0.2    0.6
   3     0.4    0.1    0.5    0.1    0.3
   4     0.9    0.7    0.1    0.6    0.7
   5     0.1    0.4    0.7    0.2    0.5

私の希望する出力は次のようになります。

以下同様に、元のデータフレームのすべての列がカバーされるまで続きます。より良い解決策は何でしょうか？

rnso

を使用df.columnsしてすべての列名を取得し、サブデータフレームを作成できます。

outdflist =[]
# for each column beyond first: 
for col in oridf.columns[1:]:
    # create a subdf with desired columns:
    subdf = oridf[['GeneID',col]]
    # append subdf to list of df: 
    outdflist.append(subdf)

# to view all dataframes created: 
for df in outdflist:
    print(df)

出力：

   GeneID    A
0       1  0.3
1       2  0.5
2       3  0.4
3       4  0.9
4       5  0.1
   GeneID    B
0       1  0.2
1       2  0.3
2       3  0.1
3       4  0.7
4       5  0.4
   GeneID    C
0       1  0.6
1       2  0.1
2       3  0.5
3       4  0.1
4       5  0.7
   GeneID    D
0       1  0.4
1       2  0.2
2       3  0.1
3       4  0.6
4       5  0.2
   GeneID    E
0       1  0.8
1       2  0.6
2       3  0.3
3       4  0.7
4       5  0.5

上記のforループは、リスト内包表記としてより簡単に記述することもできます。

outdflist = [ oridf[['GeneID', col]] 
              for col in oridf.columns[1:] ]

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-1

コメントを追加

サインイン

分類Dev

Pandasデータフレーム-複数の条件計算に基づいて複数の列を作成します

分類Dev

複数の列の値に基づいて新しいデータフレーム列を作成します

分類Dev

列の複数の値に基づいてデータフレームに新しい行を作成します

分類Dev

列の値に基づいて複数のパンダデータフレームを作成します

分類Dev

複数のデータフレームの共通のタイムスタンプに基づいてデータフレームを作成します

分類Dev

複数の条件に基づいてPandasデータフレーム列を作成します

分類Dev

Rの複数の列に基づいて2つのデータフレームをマージします

分類Dev

dplyrデータフレームの単一の列に基づいて複数の列を変更します

分類Dev

複数の列と行の基準に基づいてRデータフレームを展開します

分類Dev

列名の複数の基準に基づいてデータフレーム列を抽出します

分類Dev

Rの他の列の関数に基づいてデータフレーム列を作成します

分類Dev

前の複数の行/列の値に基づいてデータフレームの行を削除します

分類Dev

Rの条件に基づいて、データフレームに複数の新しい列を追加します

分類Dev

Pandasの共通の列に基づいて、1つのデータフレームを複数のサブデータフレームに分割します

分類Dev

Pysparkは、データフレームgroupByに基づいて複数のファイルを作成します

分類Dev

複数の列としきい値に基づいてデータフレームをマージします

分類Dev

複数の列間の接続に基づいて、データフレームの行を削除します

分類Dev

複数の列に基づいてデータフレームの最後の列に値を作成する

分類Dev

特定の基準に基づいて他の複数のデータフレームを使用してデータフレームを作成する

分類Dev

リストとデータフレームに基づいて複数の条件を持つデータフレームに新しい列を追加します

分類Dev

別のデータフレームからの複数の列条件に基づいて列を作成する

分類Dev

複数の列に基づいてRのデータフレーム行を結合します

分類Dev

R dplyr / tidyverseデータフレームの複数の列に基づいて最大日付を取得します

分類Dev

1つの列に基づいて複数のデータフレームを追加します

分類Dev

データフレームに存在する列の数に基づいて複数の列をマージして作成します-パンダ

分類Dev

Daskデータフレーム-区切り文字に基づいて列を複数の行に分割します

分類Dev

R：既存のデータフレームの複数の条件に基づいて新しいデータフレームを作成する

分類Dev

複数の列の値に基づいてデータフレームに新しい列を追加する

分類Dev

Rの別のデータフレームの別の列に基づいて、あるデータフレームの列を作成します

Related 関連記事

記事