pysparkデータフレーム列のすべてのカテゴリを印刷します

Qubix

と呼ばれる1つの列に、location都市の数が少ない大きなデータフレームがあります["New York", "London", "Paris", "Berlin"...]例:

たとえば、ある都市の値が欠落しているかどうかがわかるように、その列にすべての個別の値を印刷したいと思います。.describe('location')メソッドが役に立たないので、どうすればこれを行うことができますか?

マンリケ

これを使用すると、列に個別の値を出力できません location

from pyspark.sql import functions as F
df.select(F.col('location')).distinct()

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

既存の列のカテゴリ値に基づいてデータフレームに列を追加します

分類Dev

カテゴリ列のdinstict値の数に基づいて、pandasデータフレームからすべての行を削除します

分類Dev

R:列のカテゴリに基づいてデータフレームから重複を削除します

分類Dev

Python Pandas:別のデータフレームの文字列コメントからデータフレームのカテゴリの最大値を削除します

分類Dev

データフレーム内のすべてのカテゴリ変数からダミー変数を作成します

分類Dev

カテゴリ固有の列と値をデータフレームに追加します

分類Dev

パンダ、すべてのデータフレームを一意のカテゴリ値に変換します

分類Dev

データフレームのサブ設定を使用して、カテゴリ列を再コーディングします

分類Dev

他のデータフレーム列に基づいてパンダ列のカテゴリの値をマップします

分類Dev

Rの行または列のカテゴリに従ってデータフレームの要素を選択します

分類Dev

PySpark-すべてのデータフレーム列文字列を配列に分割します

分類Dev

データフレーム内のすべてのカテゴリ列の個別の値を抽出するには

分類Dev

2つの列で表されるカテゴリのすべての組み合わせの要約データフレームを取得する

分類Dev

2つのカテゴリ列と1つのPythonの値に基づいてデータフレームを集計します

分類Dev

Pythonパンダ:別のデータフレームのカテゴリ値に基づいて新しい列を作成します

分類Dev

Pythonのカテゴリ値データフレームに基づいて、新しい列を抽出し、値を入力します

分類Dev

dplyrを使用して、複数行の値を持つデータフレームを列カテゴリごとに1行に再構築します

分類Dev

PySparkリストデータフレームのすべての要素の後に値を追加します

分類Dev

データフレームそのカテゴリの文字列値のリストに基づいて、列をカテゴリ名に更新する

分類Dev

Pysparkデータフレームは列のすべての値を取得します

分類Dev

列の値に基づいてデータフレームのカテゴリ変数を作成する

分類Dev

PySparkデータフレームの特定の列の間に値が含まれるすべての列のリストを検索します

分類Dev

カテゴリカル列でDaskデータフレームをフィルタリングしますか?

分類Dev

ダミー列を生成する前に、データ フレームのカテゴリをフィルタリングします。

分類Dev

データフレーム内の特定のカテゴリ変数の数を取得します

分類Dev

pandas データフレームのカテゴリ値としてインデックス値を使用する

分類Dev

パンダの2つのデータフレームからマップされたデータのすべてのオカレンスを印刷します

分類Dev

データフレームに列を追加し、他の列のカテゴリ変数をテストします

分類Dev

pandasデータフレームのカテゴリデータを使用して変数の名前を変更します

Related 関連記事

  1. 1

    既存の列のカテゴリ値に基づいてデータフレームに列を追加します

  2. 2

    カテゴリ列のdinstict値の数に基づいて、pandasデータフレームからすべての行を削除します

  3. 3

    R:列のカテゴリに基づいてデータフレームから重複を削除します

  4. 4

    Python Pandas:別のデータフレームの文字列コメントからデータフレームのカテゴリの最大値を削除します

  5. 5

    データフレーム内のすべてのカテゴリ変数からダミー変数を作成します

  6. 6

    カテゴリ固有の列と値をデータフレームに追加します

  7. 7

    パンダ、すべてのデータフレームを一意のカテゴリ値に変換します

  8. 8

    データフレームのサブ設定を使用して、カテゴリ列を再コーディングします

  9. 9

    他のデータフレーム列に基づいてパンダ列のカテゴリの値をマップします

  10. 10

    Rの行または列のカテゴリに従ってデータフレームの要素を選択します

  11. 11

    PySpark-すべてのデータフレーム列文字列を配列に分割します

  12. 12

    データフレーム内のすべてのカテゴリ列の個別の値を抽出するには

  13. 13

    2つの列で表されるカテゴリのすべての組み合わせの要約データフレームを取得する

  14. 14

    2つのカテゴリ列と1つのPythonの値に基づいてデータフレームを集計します

  15. 15

    Pythonパンダ:別のデータフレームのカテゴリ値に基づいて新しい列を作成します

  16. 16

    Pythonのカテゴリ値データフレームに基づいて、新しい列を抽出し、値を入力します

  17. 17

    dplyrを使用して、複数行の値を持つデータフレームを列カテゴリごとに1行に再構築します

  18. 18

    PySparkリストデータフレームのすべての要素の後に値を追加します

  19. 19

    データフレームそのカテゴリの文字列値のリストに基づいて、列をカテゴリ名に更新する

  20. 20

    Pysparkデータフレームは列のすべての値を取得します

  21. 21

    列の値に基づいてデータフレームのカテゴリ変数を作成する

  22. 22

    PySparkデータフレームの特定の列の間に値が含まれるすべての列のリストを検索します

  23. 23

    カテゴリカル列でDaskデータフレームをフィルタリングしますか?

  24. 24

    ダミー列を生成する前に、データ フレームのカテゴリをフィルタリングします。

  25. 25

    データフレーム内の特定のカテゴリ変数の数を取得します

  26. 26

    pandas データフレームのカテゴリ値としてインデックス値を使用する

  27. 27

    パンダの2つのデータフレームからマップされたデータのすべてのオカレンスを印刷します

  28. 28

    データフレームに列を追加し、他の列のカテゴリ変数をテストします

  29. 29

    pandasデータフレームのカテゴリデータを使用して変数の名前を変更します

ホットタグ

アーカイブ