パンダ：SimpleImputerを使用すると、データフレームがシリーズに変換されますか？

debugcn 投稿 Dev

荒れ地

いくつかのNaNを含むデータフレームがあります。それらに列の平均値を入力したいと思います。それはすべて良いですが、以下のコードを適用した後、データフレームはシリーズに変更されたようです、すべての値は小数点以下の多くの場所の精度を突然持っています、元のデータフレームの列名は失われ、0に置き換えられました、 1,2、私はこれらすべてを再作成/リセットできることを知っていますが、データの基礎となる構造/タイプを変更せずにSimpleImputerを使用することは可能ですか？

impute = SimpleImputer(missing_values=np.nan, strategy='mean')
impute.fit(dfn)
dfn_mean=impute.transform(dfn)

ジェズリール

私はあなたとだけパンダソリューションを使用することができると思うDataFrame.fillnaとmean、デフォルトでは非数値列をomitedされている場合：

df = pd.DataFrame({
        'A':list('abcdef'),
         'B':[4,5,4,5,5,4],
         'C':[7,8,9,4,np.nan,3],
         'D':[1,3,5,7,1,0],
         'E':[5,3,6,9,np.nan,4],
         'F':list('aaabbb')
})

df = df.fillna(df.mean())
print (df)
   A  B    C  D    E  F
0  a  4  7.0  1  5.0  a
1  b  5  8.0  3  3.0  a
2  c  4  9.0  5  6.0  a
3  d  5  4.0  7  9.0  b
4  e  5  6.2  1  5.4  b
5  f  4  3.0  0  4.0  b

ソリューションは、float列のみを次のように処理して変更する必要がありますDataFrame.select_dtypes。

from sklearn.impute import SimpleImputer
impute = SimpleImputer(missing_values=np.nan,strategy='mean')

c = df.select_dtypes(np.floating).columns
df[c] = impute.fit_transform(df[c])
print (df)
   A  B    C  D    E  F
0  a  4  7.0  1  5.0  a
1  b  5  8.0  3  3.0  a
2  c  4  9.0  5  6.0  a
3  d  5  4.0  7  9.0  b
4  e  5  6.2  1  5.4  b
5  f  4  3.0  0  4.0  b

または、数値のみですが、整数列は浮動小数点数に変換されます。

from sklearn.impute import SimpleImputer
impute = SimpleImputer(missing_values=np.nan,strategy='mean')

c = df.select_dtypes(np.number).columns
df[c] = impute.fit_transform(df[c])
print (df)
   A    B    C    D    E  F
0  a  4.0  7.0  1.0  5.0  a
1  b  5.0  8.0  3.0  3.0  a
2  c  4.0  9.0  5.0  6.0  a
3  d  5.0  4.0  7.0  9.0  b
4  e  5.0  6.2  1.0  5.4  b
5  f  4.0  3.0  0.0  4.0  b

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

パンダ：SimpleImputerを使用すると、データフレームがシリーズに変換されますか？

パンダ：SimpleImputerを使用すると、データフレームがシリーズに変換されますか？

パンダシリーズをデータフレームに変換する

パンダシリーズのリストをパンダデータフレームに変換する

多次元のパンダシリーズをパンダデータフレームに変換するにはどうすればよいですか？

パンダデータフレームをパンダシリーズに変換する

パンダシリーズをデータフレームに変換して他のデータフレームとマージする方法

パンダのデータフレームの行を（シリーズではなく）データフレーム自体に変換しますか？

列がシリーズのレベルである（パンダ/ Pythonの）データフレームでシリーズを変換します

シリーズの値のリストをデータフレームパンダに変換する方法

numpy配列値を持つパンダシリーズをデータフレームに変換する方法

パンダ：CSVシリーズをデータフレームに変換します

パンダのデータフレームをカスタマイズされたjsonに変換する

マルチキーディクショナリをパンダデータフレームに変換するにはどうすればよいですか？各キーと値には独自の列がありますか？

すべての行に同じシリーズがあるパンダデータフレームに行としてシリーズを適用します

numpy行列をパンダのデータフレームまたはシリーズに行ごとに変換します

シリーズではなくパンダデータフレーム全体をスライスすると、データ型が変更され、最初のフィールドのNaNへの値の割り当てが変更されます。何が起こっているのでしょうか。

パンダデータフレームをシリーズに変換

パンダ：キーと値が列であるデータフレームに辞書を変換します

パンダのデータフレームを、列の値の1つがキーとして使用されるdefaultdict（クラス、リスト）に変換するにはどうすればよいですか？

pandas-データフレームにシリーズを追加すると、NaN値が表示されます

データフレームとシリーズを連結するパンダ

パンダシリーズとデータフレームオブジェクトをnumpy配列に変換します

パンダでネストされたリストをデータフレームに変換する方法

パンダのデータフレームにシリーズを追加する

パンダの単一列データフレームをシリーズまたは派手なベクトルに変換する方法

パンダ：隣接する行ごとにデータフレームをデータフレームのリストに変換します

一意の列値パンダデータフレームごとに行シリーズを追加するにはどうすればよいですか？

Pythonパンダのデータフレーム列はdictキーと値に変換されます

パンダ：エントリが変更された場合、データフレームを別のデータフレームにマージします

パンダのデータフレームをシリーズとして取得するにはどうすればよいですか？