na()。drop()とfilter(col.isNotNull)の違い(Apache Spark)

JiriS:

間の意味論のいずれかの差があるdf.na().drop()され、Apacheのスパークはdf.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull() && !df.col("onlyColumnInOneColumnDataFrame").isNaN())df Dataframe

または、最初nullの列が後で返されない(文字列nullではなく単にnull値である)場合、それをバグと見なしonlyColumnInOneColumnDataFrame、2番目の列は返すでしょうか?

編集:追加さ!isNaN()れました。onlyColumnInOneColumnDataFrame与えられた唯一の列ですDataframeタイプがであるとしましょうInteger

ダニエルゾルナイ:

ではdf.na.drop()、あなた含む行ドロップ任意の nullまたはNaN値を。

ではdf.filter(df.col("onlyColumnInOneColumnDataFrame").isNotNull())、あなただけの列にヌルを持っているそれらの行をドロップしますonlyColumnInOneColumnDataFrame

あなたが同じことを達成したいのであれば、それはですdf.na.drop(["onlyColumnInOneColumnDataFrame"])

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

na()。drop()とfilter(col.isNotNull)の違い(Apache Spark)

分類Dev

na()。drop()とfilter(col.isNotNull)の違い(Apache Spark)

分類Dev

Apache SparkのRowMatrixとMatrixの違いは?

分類Dev

Apache Spark SQLとMongoDBの違いは?

分類Dev

org.apache.spark.ml.classificationとorg.apache.spark.mllib.classificationの違い

分類Dev

Apache MahoutとApache SparkのMLlibの違いは何ですか?

分類Dev

Apache Sparkのjoinとcogroupの違いは何ですか

分類Dev

Apache Sparkのjoinとcogroupの違いは何ですか

分類Dev

Apache Sparkのjoinとcogroupの違いは何ですか

分類Dev

Apache SparkのforEachAsyncとforEachPartitionAsyncの違いは何ですか?

分類Dev

Spark ScalaでのGroupByKey($ "col")とGroupBy($ "col")の違い

分類Dev

Spark:Reduce()とFold()の違い

分類Dev

Apache Spark:並列化とブロードキャストの違い

分類Dev

Scala、Sparkでの==と===の違い

分類Dev

Scala、Sparkでの==と===の違い

分類Dev

SparkのAlluxio(Tachyon)とTungstenの違いは?

分類Dev

Sparkのsc.textFileとspark.read.textの違い

分類Dev

Spark:spark.sqlとsqlCtx.sqlの違いは何ですか

分類Dev

これら2つのクエリの「ISNOTNULL」と「NOT(フィールド= NULL)」の違い

分類Dev

Apache SparkとApache Ignite

分類Dev

Apache SparkとApache Ignite

分類Dev

Apache SparkとApache Ignite

分類Dev

Apache Sparkでのreduce()とfold()

分類Dev

Apache NiFiとStreamSetsの違い

分類Dev

Apache NiFiとStreamSetsの違い

分類Dev

Apache NiFiとStreamSetsの違い

分類Dev

Sparkの密なランクと行番号の違い

分類Dev

SparkのHashingTFとCountVectorizerの違いは何ですか?

分類Dev

Spark:reduceとreduceByKeyのセマンティクスの違い

Related 関連記事

  1. 1

    na()。drop()とfilter(col.isNotNull)の違い(Apache Spark)

  2. 2

    na()。drop()とfilter(col.isNotNull)の違い(Apache Spark)

  3. 3

    Apache SparkのRowMatrixとMatrixの違いは?

  4. 4

    Apache Spark SQLとMongoDBの違いは?

  5. 5

    org.apache.spark.ml.classificationとorg.apache.spark.mllib.classificationの違い

  6. 6

    Apache MahoutとApache SparkのMLlibの違いは何ですか?

  7. 7

    Apache Sparkのjoinとcogroupの違いは何ですか

  8. 8

    Apache Sparkのjoinとcogroupの違いは何ですか

  9. 9

    Apache Sparkのjoinとcogroupの違いは何ですか

  10. 10

    Apache SparkのforEachAsyncとforEachPartitionAsyncの違いは何ですか?

  11. 11

    Spark ScalaでのGroupByKey($ "col")とGroupBy($ "col")の違い

  12. 12

    Spark:Reduce()とFold()の違い

  13. 13

    Apache Spark:並列化とブロードキャストの違い

  14. 14

    Scala、Sparkでの==と===の違い

  15. 15

    Scala、Sparkでの==と===の違い

  16. 16

    SparkのAlluxio(Tachyon)とTungstenの違いは?

  17. 17

    Sparkのsc.textFileとspark.read.textの違い

  18. 18

    Spark:spark.sqlとsqlCtx.sqlの違いは何ですか

  19. 19

    これら2つのクエリの「ISNOTNULL」と「NOT(フィールド= NULL)」の違い

  20. 20

    Apache SparkとApache Ignite

  21. 21

    Apache SparkとApache Ignite

  22. 22

    Apache SparkとApache Ignite

  23. 23

    Apache Sparkでのreduce()とfold()

  24. 24

    Apache NiFiとStreamSetsの違い

  25. 25

    Apache NiFiとStreamSetsの違い

  26. 26

    Apache NiFiとStreamSetsの違い

  27. 27

    Sparkの密なランクと行番号の違い

  28. 28

    SparkのHashingTFとCountVectorizerの違いは何ですか?

  29. 29

    Spark:reduceとreduceByKeyのセマンティクスの違い

ホットタグ

アーカイブ