検索

検索

条件と値のリストに基づいてpysparkデータフレームを作成します

debugcn 投稿 Dev

4

pyds_learner

私は、変数に値がある-IDなどを1し、10個の値のリストは言います

LIST1 = [1,2,3,4,5,6,7,8,9,10]。

ここで、以下のようにpysparkデータフレームを作成したいと思いました。

注：List1の長さは動的であり、その長さに基づいて、それに応じて行を設定する必要があります。

オタクモス

IDが一定であるか、ID 2のList2があり、両方を1つのDataFrameに結合するかによって異なります。

定数に関する限り、2つのオプションがあります。

ID = 1
LIST1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

source = list(map(lambda x: (ID, x), LIST1))
# source: [(1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6), (1, 7), (1, 8), (1, 9), (1, 10)]

df = spark.createDataFrame(source, ['ID', 'LIST'])
df.show()
# +---+----+                                                                      
# | ID|LIST|
# +---+----+
# |  1|   1|
# |  1|   2|
# |  1|   3|
# |  1|   4|
# |  1|   5|
# |  1|   6|
# |  1|   7|
# |  1|   8|
# |  1|   9|
# |  1|  10|
# +---+----+

または

from pyspark.sql.functions import lit

ID = 1
LIST1 = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

source = list(map(lambda x: (x,), LIST1))
# createDataFrame needs iter of iters -> list/tuple of lists/tuples
df = spark.createDataFrame(source, ['LIST'])
df.withColumn('ID', lit(ID)).show()
+----+---+
|LIST| ID|
+----+---+
|   1|  1|
|   2|  1|
|   3|  1|
|   4|  1|
|   5|  1|
|   6|  1|
|   7|  1|
|   8|  1|
|   9|  1|
|  10|  1|
+----+---+

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-2

0

コメントを追加

0

サインイン

関連記事

分類Dev

条件に基づいてデータフレームの値をリストに移動します

分類Dev

リストとデータフレームに基づいて複数の条件を持つデータフレームに新しい列を追加します

分類Dev

Pysparkのデータフレームの条件に基づいて新しいリスト値を設定するにはどうすればよいですか？

分類Dev

そのデータフレームの値に基づいて、データフレームのリストの名前を作成します

分類Dev

条件としての値のリストに基づいて、データフレームから行を削除します

分類Dev

Pyspark：複数の条件に基づいてデータフレームをフィルタリングします

分類Dev

条件に基づいてデータフレームの値を代入します

分類Dev

リストの最初の要素に基づいて照合するデータフレームを作成します

分類Dev

Pythonのデータフレームの条件に基づいて可能なすべての一意の組み合わせでリストを作成します

分類Dev

データフレーム内のIDに基づいてリストを作成します

分類Dev

Pandasデータフレームのリストに基づいて列の値を比較します

分類Dev

列の値に基づいてデータフレームの行を返します。Rスクリプト

分類Dev

リスト値に基づいてPandasデータフレームの行を更新します

分類Dev

列の値に基づいてリストからデータフレームを選択します

分類Dev

Rのデータフレームの列条件に基づいてベクトルを作成します

分類Dev

リストとして指定されたパラメーターとパンダの特定の条件に基づいて、データフレームに新しい行を作成する関数を作成します

分類Dev

Python：ネストされたリストの一意の値に基づいて列を持つパンダデータフレームを作成します

分類Dev

特定の月の値に基づいて、別の列を条件としてパンダのデータフレームをフィルタリングします

分類Dev

特定の月の値に基づいて、別の列を条件としてパンダのデータフレームをフィルタリングします

分類Dev

データフレーム操作：データフレームの特定の列をキー値列に基づいてリストに変換します

分類Dev

Multindexとデータフレームに基づいてMultiIndexデータフレームを作成します（比較マトリックス）

分類Dev

条件に基づいてパンダデータフレームの値をマスクします

分類Dev

既存の数値列、列名などの文字列のリストと値としてタプルのリストに基づいてデータフレームに新しい列を作成します。

分類Dev

列の共通値に基づいて、大きなデータフレームをデータフレームのリストに分割します

分類Dev

データフレームのリストと列の間の値の一致に基づいて、新しいデータフレームを作成します

分類Dev

複数の条件に基づいてPySparkデータフレームの行を削除します

分類Dev

リストに基づいてデータフレームから辞書として値を抽出する

分類Dev

既存の列の条件に基づいて、データフレームに新しい列を作成します

分類Dev

Pysparkは、データフレームgroupByに基づいて複数のファイルを作成します

Related 関連記事

記事

ホットタグ

アーカイブ