と呼ばれる1つの列に、location
都市の数が少ない大きなデータフレームがあります["New York", "London", "Paris", "Berlin"...]
。例:。
たとえば、ある都市の値が欠落しているかどうかがわかるように、その列にすべての個別の値を印刷したいと思います。.describe('location')
メソッドが役に立たないので、どうすればこれを行うことができますか?
これを使用すると、列に個別の値を出力できません location
from pyspark.sql import functions as F
df.select(F.col('location')).distinct()
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加