NaNがデータフレームピボットのインデックスと列になるのを防ぐ

debugcn 投稿 Dev

Chrisvdberge

2列のすべての増分の値を含めるように拡張するデータフレームがあります。そのため、期待どおり、必要に応じてNaN値が導入されます。

ただし、このデータフレームでピボットを使用すると、NaNの行と列が取得されます。ピボットを行うときにこれを防ぐことはできますか？そうでない場合、NaNという名前の列を削除するにはどうすればよいですか？[NaN]、[nan]、または['NaN']を呼び出してドロップしようとしても機能しません。

この場合、列見出しとインデックスは海のヒートマッププロットに使用されるため、すべての値がNaNである列と行を削除しても機能しません。したがって、すべてのセル値がNaNであっても、インデックスとキー値として使用すると便利です。 NaNではありません

サンプルコード;

import pandas as pd
import numpy as np

#generate dummy data
df = pd.DataFrame({'Y': np.random.randint(130,140,10),
                   'X': np.random.randint(5,10,10),
                   'Z': np.random.randint(0,25, size=10)})
df = df.round(1)
#create dataset for heatmap
#group by axis to plot
df = df.groupby(['X','Y']).sum().reset_index()
df = df.sort_values(by=['Y'])
dfY = pd.DataFrame({'Y':np.arange(min(df['Y']), max(df['Y']),1)})
dfX = pd.DataFrame({'X':np.arange(min(df['X']), max(df['X']),1)})
df = pd.merge(df,dfY, how='outer', on='Y')
df = pd.merge(df,dfX, how='outer', on='X')
df = df.round(1)

print(df)
#restructure for heatmap
data = df.pivot("Y","X","Z").sort_values(by=['Y'],ascending=False)
print(data)

ピボット前のサンプルDataFrame：

      X      Y     Z
0   5.0  132.0   0.0
1   5.0  135.0  20.0
2   5.0  137.0  17.0
3   7.0  132.0  15.0
4   7.0  133.0   3.0
5   6.0  133.0  30.0
6   6.0  135.0  22.0
7   6.0  138.0  16.0
8   9.0  135.0   9.0
9   NaN  134.0   NaN
10  NaN  136.0   NaN
11  8.0    NaN   NaN

ピボット後：

X       NaN    5.0   6.0   7.0   8.0   9.0
Y                                         
 138.0   NaN   NaN  16.0   NaN   NaN   NaN
 137.0   NaN  17.0   NaN   NaN   NaN   NaN
 136.0   NaN   NaN   NaN   NaN   NaN   NaN
 135.0   NaN  20.0  22.0   NaN   NaN   9.0
 134.0   NaN   NaN   NaN   NaN   NaN   NaN
 133.0   NaN   NaN  30.0   3.0   NaN   NaN
 132.0   NaN   0.0   NaN  15.0   NaN   NaN
NaN      NaN   NaN   NaN   NaN   NaN   NaN

必要な出力：

X        5.0   6.0   7.0   8.0   9.0
Y                                         
 138.0   NaN  16.0   NaN   NaN   NaN
 137.0  17.0   NaN   NaN   NaN   NaN
 136.0   NaN   NaN   NaN   NaN   NaN
 135.0  20.0  22.0   NaN   NaN   9.0
 134.0   NaN   NaN   NaN   NaN   NaN
 133.0   NaN  30.0   3.0   NaN   NaN
 132.0   0.0   NaN  15.0   NaN   NaN

ジェズリール

drop欠測値で作業している私にとってnp.nan：

data = (df.pivot("Y","X","Z")
         .sort_values(by=['Y'],ascending=False)
         .drop(np.nan, axis=1)
         .drop(np.nan))

または：

data = df.pivot("Y","X","Z").sort_values(by=['Y'],ascending=False)

data = data.reindex(index=data.index.difference([np.nan]),
                    columns=data.columns.difference([np.nan]))

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-7

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

NaNがデータフレームピボットのインデックスと列になるのを防ぐ

NaNがデータフレームピボットのインデックスと列になるのを防ぐ

数値以外のデータを含むインデックス列に重複があるピボット/ Groupbyデータフレーム

2つのPandasデータフレーム（ピボットされている）を列の階層インデックスとマージする方法

どのようにTypeErrorを防ぐことができますか：Pythonリストをnumpy配列にコピーするとき、リストのインデックスはタプルではなく整数でなければなりませんか？

複数の列をインデックスとして使用してdaskデータフレームをピボットする

インデックスと列が別のデータフレームの値であるPandasデータフレームにデータを入力する

デスクトップarchlinuxボックスがスリープ状態になるのを防ぐ

データフレームピボットの戻りエラー：インデックスに重複するエントリが含まれています

特定のインデックス名（文字列）を新しいデータフレームにコピーする

インデックスとして2つの列を持つデータフレームをピボットします

Python：パンダのデータフレームを変換して、インデックスと列のIDが行の要素になるようにします

Pandasデータフレームのマルチインデックスを使用したピボット

スクロールなしボタンがページのトップに戻るのを防ぐ

データフレームの値を列に「ピボット」する方法

配列をScalaの列とインデックスを持つデータフレームに変換する

連結されたデータフレームを使用すると、「IndexError：文字列インデックスが範囲外」になるのはなぜですか

スタックレイアウトフォームのラベルが途切れるのを防ぐ方法

値がnullで、nanがないelasticsearchのパンダデータフレームにインデックスを付ける

日時インデックスの粒度が異なるデータフレーム列を減算する

欠測データのあるリストと列を組み合わせてデータフレームを作成する、strsplit、インデックスなし

他のデータフレームの行と列の情報に基づいてデータフレームにインデックスを付ける

フォーム内のボタンがクリックされたときにページの更新を防ぐ

パンダのデータフレームをピボットして、マルチインデックスの列を作成します

戻るボタンにonbeforeunloadを使用するが、フォームの送信と内部ページのリダイレクトを防ぐ方法

ピボットデータフレームのインデックスを特定のユーザー定義の順序で並べ替える

追加の列を重複排除しながらPandasデータフレームをピボットする

マイクロソフトボットフレームワークのテキストデータにライブスピーチを追加する方法（正確にはグーグルスピーチが行うこと）

フレックスダッシュボードコンテナで追加のテキストによってテーブル（データテーブル）が切り捨てられるのを防ぐにはどうすればよいですか？

リストRの各データフレームにインデックス列を追加する