データフレーム内のすべての列を連結します

debugcn 投稿 Dev

Ardalan Shahgholi

私はDatabricksでPythonをコーディングしており、spark2.4.5を使用しています。

2つのパラメーターを持つUDFが必要です。1つ目はデータフレームで2つ目はSKidです。そのデータフレームでは、そのデータフレームのすべての列をハッシュする必要があります。

以下のコードを記述しましたが、動的データフレームのすべての列を連結する方法を知る必要がありますか？

def xHashDataframe(df,skColumn):
  a = df.select(
      col(skColumn)
      ,md5(
      concat(
        col("column1"), lit("~"), 
        col("column2"), lit("~"),
        ...
        col("columnN"), lit("~")
      )).alias("RowHash")
    )
  return a

ヴェルナー

UDFを使用する必要はありません。concat_wsはトリックを行う必要があります：

df.withColumn("RowHash", F.md5(F.concat_ws("~", *df.columns))).show(truncate=False)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-26

コメントを追加

サインイン

分類Dev

NaNを除くデータフレーム内のすべての列を連結します

分類Dev

データフレーム内の列を連結し、番号に基づいて並べ替えます

分類Dev

すべてのデータフレーム列を単一の列に連結します

分類Dev

パンダのデータフレームのすべての列を連結します

分類Dev

データフレーム内の文字列を連結します

分類Dev

javaを使用して、sparkデータフレームのすべての列を連結する方法

分類Dev

各行のすべての列を文字列として連結し、それをRの別のデータフレームに書き込みます

分類Dev

データフレームの2つの列の値を連結します

分類Dev

データフレーム内の列を連結し、新しいIDを生成します

分類Dev

最初の列で並べ替えずに2つのPandasデータフレームを連結します

分類Dev

データフレーム全体の列のペアを連結します

分類Dev

pandas データフレームの 2 つの列を連結します

分類Dev

2つのパンダデータフレームを連結し、列を並べ替えます

分類Dev

SparkデータフレームのgroupByの後の文字列を連結して置換します

分類Dev

文字列をインデックスとして2つのデータフレームを連結します

分類Dev

データフレームの2行を連結します

分類Dev

データフレームの列を区切り文字で連結します

分類Dev

2つのデータフレームを列で連結します

分類Dev

Pythonでデータフレームの列を連結しますか？

分類Dev

データフレーム内のすべての列について、しきい値を超える連続した値をカウントします

分類Dev

Pandasデータフレーム内の文字列を条件付きで連結します

分類Dev

2つのデータフレームを結合し、すべての列をパンダに保持します

分類Dev

データフレームの特定の列のすべての行で .join を使用してリスト内のすべての要素を結合する方法

分類Dev

データフレーム内のすべてのセルの文字列の長さを制限しますか？

分類Dev

データフレーム内のすべてのセルの文字列の長さを制限しますか？

分類Dev

パンダ：データフレーム内のすべての列を文字列に変換します

分類Dev

Scalaを使用してSparkデータフレーム内のリストの各要素に文字列を連結します

分類Dev

R-データフレーム内の文字列のすべての場所を検索します

分類Dev

類似の列値に基づいてデータフレームを連結します

Related 関連記事

記事