間の意味論のいずれかの差があるdf.na().drop()
とされ、Apacheのスパークは?df.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull() && !df.col("onlyColumnInOneColumnDataFrame").isNaN())
df
Dataframe
または、最初null
の列が後で返されない(文字列nullではなく単にnull
値である)場合、それをバグと見なしonlyColumnInOneColumnDataFrame
、2番目の列は返すでしょうか?
編集:追加さ!isNaN()
れました。onlyColumnInOneColumnDataFrame
与えられた唯一の列ですDataframe
。タイプがであるとしましょうInteger
。
ではdf.na.drop()
、あなた含む行ドロップ任意の nullまたはNaN値を。
ではdf.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull())
、あなただけの列にヌルを持っているそれらの行をドロップしますonlyColumnInOneColumnDataFrame
。
あなたが同じことを達成したいのであれば、それはですdf.na.drop(["onlyColumnInOneColumnDataFrame"])
。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加