ユーザー定義関数を使用してグループ化を実行するにはどうすればよいですか？

debugcn 投稿 Dev

ネイト・ルメイ

したがって、2つのデータフレームがあります。1つは多くの列を持つ完全なデータセットであり、各行は観測値です。

2番目のデータフレームは最初のデータフレームのサブセットですが、「county」と呼ばれる変数によって列内の欠落している値の％をカウントします。

これまでのところ、意図した結果を提供し、列全体に欠落している％を提供する関数があります。

def missing_count(df, var):
    percent_missing= df[var].isnull().sum() * 100 / len(df)
    return round(percent_missing,2)

しかし、私がやりたいのは、それを郡に固有のものにすることです。例-ケース番号は、郡yで12％欠落しており、郡xで15％欠落しています。コードは現在、データフレーム全体で欠落しているケース番号の数を示しています。データフレーム全体に66の一意の郡があると仮定して、66の個別の欠落カウントを探しています。

groupbyを使用して結果を取得しようとしていますが、機能していません。

df2['casenumber'] = df.groupby(by='county').apply(missing_count(df, 'casenumber'))

しかし、これは機能せず、「TypeError： 'numpy.float64'オブジェクトは呼び出せません」というメッセージが表示されます。

私は何が間違っているのですか？

クアンホアン

系列またはキーワード変数のいずれかを取るように関数を書き直す必要がありますval。

# series:
def missing_count(s, var):
    percent_missing= s.isnull().sum() * 100 / s
    return round(percent_missing,2)

df.groupby('county')['casenumber'].apply(missing_count)


# or keyword `val`
# careful for `KeyError`
def missing_count(d, var=None)
    percent_missing= df[var].isnull().sum() * 100 / len(df)
    return round(percent_missing,2)

df.groupby('county').apply(missing_count, var='casenumber')

そうは言っても、コードは次のように書くことができます。これはよりパフォーマンスが高いはずです。

df['case_number'].isnull().groupby(df['county']).mean()

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-13

コメントを追加

サインイン

分類Dev

ユーザー定義関数をPythonのユーザー入力として使用するにはどうすればよいですか？

分類Dev

Spark SQLでユーザー定義の集計関数を定義して使用するにはどうすればよいですか？

分類Dev

ユーザー定義関数内でLAG（）を使用するにはどうすればよいですか？

分類Dev

関数でユーザー定義型を使用するにはどうすればよいですか？

分類Dev

Pythonの各グループにユーザー定義関数を適用するにはどうすればよいですか？

分類Dev

関数を実行し、ユーザー入力を待ってから、別の関数を実行するにはどうすればよいですか？

分類Dev

while ループ内で実行されている関数で変数を定義するにはどうすればよいですか?

分類Dev

マクロでユーザー定義リテラル（UDL）を使用して文字列化を構成するにはどうすればよいですか？

分類Dev

if-then式をユーザー定義関数に追加するにはどうすればよいですか？

分類Dev

ユーザー定義関数内の配列を削除するにはどうすればよいですか？

分類Dev

mapPartitionsを使用してRDDのパーティションでPythonユーザー定義関数を実行するにはどうすればよいですか？

分類Dev

Intelの自動ベクトル化でユーザー定義関数を許可するにはどうすればよいですか？

分類Dev

ユーザー定義関数をPerlの組み込み関数として追加するにはどうすればよいですか？

分類Dev

`IF`式の中でユーザー定義変数を使用するにはどうすればよいですか？

分類Dev

DB2モジュールでテーブルを返すユーザー定義関数を作成するにはどうすればよいですか？

分類Dev

PXSelectを使用してユーザー定義フィールドを取得するにはどうすればよいですか？（別名extフィールド）

分類Dev

JMeterのすべてのループ/スレッドのユーザー定義変数を再計算するにはどうすればよいですか？

分類Dev

<forcedType>タグを使用して生成されたユーザー定義のPL / pgSQL関数のjOOQでINPUTパラメーターの適切な値の型を生成することを修正するにはどうすればよいですか？

分類Dev

Pythonのユーザー定義関数に「位置のみのパラメーター」を実装するにはどうすればよいですか？

分類Dev

複数のユーザーが同じシステムを使用してテンソルフロープログラムを一度に実行できるようにするにはどうすればよいですか？

分類Dev

ユーザー定義型変数をパラメーターとして関数に渡すにはどうすればよいですか？

分類Dev

Node.jsを使用して外部スコープでコールバック関数を定義するにはどうすればよいですか？

分類Dev

ユーザー定義の等式関数を使用してJavascriptでユーザー定義オブジェクトのセットを作成するにはどうすればよいですか？

分類Dev

DjangoのChoicesを使用して、フィールドでユーザー定義の「その他」を作成するにはどうすればよいですか？

分類Dev

AWS redshiftユーザー定義関数に文字列を渡すにはどうすればよいですか？

分類Dev

SETを使用してmysqlでLAST_INSERT_IDユーザー定義変数を作成するにはどうすればよいですか？

分類Dev

ユーザー定義関数を使用するBigQueryビューを作成するにはどうすればよいですか？

分類Dev

ターミナルコマンドを使用してユーザー定義のSamba共有を追加するにはどうすればよいですか？

分類Dev

xarrayを使用して時間をグループ化し、グループに対してbin関数を実行するにはどうすればよいですか？

Related 関連記事

記事