pysparkデータフレーム集計の列の名前を変更する

debugcn 投稿 Dev

cantdutchthis：

pysparkデータフレームを使用して一部のデータを分析していますが、集計しているデータフレームがdfあるとします。

df.groupBy("group")\
  .agg({"money":"sum"})\
  .show(100)

これは私に与えます：

group                SUM(money#2L)
A                    137461285853
B                    172185566943
C                    271179590646

集計は問題なく機能しますが、新しい列名 "SUM（money＃2L）"は嫌いです。この列の名前を.aggメソッドから人間が読み取れるものに変更するためのきちんとした方法はありますか？たぶん、人がすることともっと似たものかもしれませんdplyr：

df %>% group_by(group) %>% summarise(sum_money = sum(money))

cantdutchthis：

私は今でもdplyr構文を好みますが、このコードスニペットは次のようになります。

import pyspark.sql.functions as sf

df.groupBy("group")\
  .agg(sf.sum('money').alias('money'))\
  .show(100)

冗長になります。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-04-7

コメントを追加

サインイン

分類Dev

データフレーム名の後に列の名前を変更する

分類Dev

データフレームの特定の列の名前を変更する

分類Dev

集計関数を使用してデータフレームを生成した後、列の名前を変更するとエラーが発生しました

分類Dev

データフレームの列の名前を変更する方法

分類Dev

データフレームの名前を変更する

分類Dev

データフレーム内の各列の集計、ランキング、ビニング、名前の変更

分類Dev

Pandasデータフレームリストの列の名前を別の名前に変更する方法

分類Dev

別のデータフレームの名前で列の名前を変更する

分類Dev

Pandasデータフレームの列の名前を変更し、タイプを変更する

分類Dev

pysparkでデータフレームの列名の名前を変更する方法は？

分類Dev

別の特定の列を使用してデータフレームの列の名前を変更する

分類Dev

データフレームの列の文字変数の名前を変更する-R

分類Dev

データフレームの列の文字変数の名前を変更する-R

分類Dev

列名を使用せずにデータフレームの列変数の名前を変更する

分類Dev

SparkPythonでデータフレーム列の名前を変更します

分類Dev

Rのデータフレーム内の特定の列の名前を変更する

分類Dev

データフレーム内の同じ名前の列名を変更する

分類Dev

データフレーム内のIDの名前を変更する

分類Dev

データフレーム内の観測値の名前を変更する

分類Dev

個別のデータフレームの値を使用して列の名前を変更する

分類Dev

列インデックスに基づいてデータフレーム列の名前を変更する

分類Dev

重複する列名を持つPandasデータフレームの列の名前を変更しますか？

分類Dev

pandasデータフレームの列の名前を変更する関数を作成しています

分類Dev

Scalaデータフレームの列ヘッダーの名前を変更する方法

分類Dev

パンダデータフレームの最初の10列の名前を変更する

分類Dev

データフレーム内の複数の列の名前を変更する

分類Dev

ある条件でパンダデータフレームの列値の名前を変更する方法

分類Dev

データフレームの列の名前を変更するために使用されるR関数

分類Dev

別のデータフレームからの一致を使用して、データフレームのリストの列の名前を変更する

Related 関連記事

記事