同様のインデックスを持つ他のデータフレームの列からパンダデータフレームを作成する

debugcn 投稿 Dev

user3153467：

同じ列名['a'、 'b'、 'c']を持ち、日付でインデックスが付けられた2つのデータフレームdf1とdf2があります。日付インデックスは同様の値を持つことができます。列['c']からのデータのみがそれぞれ 'df1'および 'df2'に名前変更され、正しい日付インデックスでDataFrame df3を作成したいと思います。私の問題は、インデックスを適切にマージする方法を取得できないことです。

df1 = pd.DataFrame(np.random.randn(5,3), index=pd.date_range('01/02/2014',periods=5,freq='D'), columns=['a','b','c'] )
df2 = pd.DataFrame(np.random.randn(8,3), index=pd.date_range('01/01/2014',periods=8,freq='D'), columns=['a','b','c'] )
df1
                 a        b            c
2014-01-02   0.580550    0.480814    1.135899
2014-01-03  -1.961033    0.546013    1.093204
2014-01-04   2.063441   -0.627297    2.035373
2014-01-05   0.319570    0.058588    0.350060
2014-01-06   1.318068   -0.802209   -0.939962

df2
                 a        b            c
2014-01-01   0.772482    0.899337    0.808630
2014-01-02   0.518431   -1.582113    0.323425
2014-01-03   0.112109    1.056705   -1.355067
2014-01-04   0.767257   -2.311014    0.340701
2014-01-05   0.794281   -1.954858    0.200922
2014-01-06   0.156088    0.718658   -1.030077
2014-01-07   1.621059    0.106656   -0.472080
2014-01-08  -2.061138   -2.023157    0.257151

df3 DataFrameの形式は次のとおりです。

df3
                 df1        df2
2014-01-01   NaN        0.808630
2014-01-02   1.135899   0.323425
2014-01-03   1.093204   -1.355067
2014-01-04   2.035373   0.340701
2014-01-05   0.350060   0.200922
2014-01-06   -0.939962  -1.030077
2014-01-07   NaN        -0.472080
2014-01-08   NaN        0.257151

ただし、df2列の日付インデックスが広いため、df1列にNaNが含まれています。（この例では、私はollowing日付にはNaNになるだろう。2014-01-01, 2014-01-07 and 2014-01-08）

ご協力いただきありがとうございます。

アンディ・ヘイデン：

あなたはconcatを使うことができます：

In [11]: pd.concat([df1['c'], df2['c']], axis=1, keys=['df1', 'df2'])
Out[11]: 
                 df1       df2
2014-01-01       NaN -0.978535
2014-01-02 -0.106510 -0.519239
2014-01-03 -0.846100 -0.313153
2014-01-04 -0.014253 -1.040702
2014-01-05  0.315156 -0.329967
2014-01-06 -0.510577 -0.940901
2014-01-07       NaN -0.024608
2014-01-08       NaN -1.791899

[8 rows x 2 columns]

軸の引数は、DataFrameのスタック方法を決定します。

df1 = pd.DataFrame([1, 2, 3])
df2 = pd.DataFrame(['a', 'b', 'c'])

pd.concat([df1, df2], axis=0)
   0
0  1
1  2
2  3
0  a
1  b
2  c

pd.concat([df1, df2], axis=1)

   0  0
0  1  a
1  2  b
2  3  c

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-04-2

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

同様のインデックスを持つ他のデータフレームの列からパンダデータフレームを作成する

同様のインデックスを持つ他のデータフレームの列からパンダデータフレームを作成する

同様のインデックスを持つ別のデータフレームに列をコピーする方法をパンダ

同じインデックスと列を持つ2つのパンダデータフレームから計算を実行する最速の方法

同じインデックスを持つ最初のデータフレームから行を削除しながら、パンダのデータフレームをマージするにはどうすればよいですか？

パンダ：他のデータフレーム情報からデータフレーム行を作成する

パンダデータフレーム同じインデックスを持つ複数の行

パンダ/ダスク：マルチインデックスまたは2番目のデータフレームの他の2つの列からデータフレームをフィルタリングしますか？

同じ列インデックスを持つパンダデータフレームに列として配列のリストを追加します

パンダ：いくつかの異なるインデックスと列を持つ（合計）データフレームを追加します

パンダで同じインデックスを持つ2つのデータフレームをマージする

他のデータフレーム（パンダ、パイソン）からの一意の値を持つデータフレーム

異なるインデックスを持つ別のデータフレームからパンダデータフレームに新しい列を追加する

ソートされていないインデックスを持つ複数のパンダデータフレームから別のデータフレームの既存の列に値を挿入します

パンダで同じインデックスを持つ3つ以上のデータフレームを合計する

他の列のインデックス値を使用した、パンダデータフレームの1つの列の文字列インデックス

パンダの2つのデータフレームのインデックスの値を比較する

インデックスの値にリンクされた色を持つデータフレームから一連の円グラフを作成する

Python：パンダのデータフレームからインデックスを選択する方法は？

2つのデータフレームから一致する文字列のインデックスを取得

他の列の望ましい部分にインデックスを付けて、パンダデータフレームに新しい列を作成する方法

マルチインデックスパンダシリーズから1列のデータフレームを作成する

パンダのデータフレームからカスタムヒートマップを作成する

既存のデータフレームから特定の列のトップ10から新しいパンダデータフレームを作成する方法

オフセットインデックスを持つパンダのデータフレームの列の最初の値を取得します

列名からパンダデータフレームのインデックスを再作成

配列をScalaの列とインデックスを持つデータフレームに変換する

パンダはデータフレームをコピーし、同じインデックスを持つ行の最大値のみを保持します

パンダのデータフレームからの同様のデータセットの最初の行を特定する

高度なパンダ：特定の行インデックスからマルチインデックスパンダデータフレームを作成します

既存のデータフレームからマルチインデックス列Pandasデータフレームを作成する