データフレームフィルターの問題、どうすればよいですか?

ジョン

Env:Spark 1.6、Scala

私のデータフレームは次のようなものです

DF =
DT col1 col2
---------- | --- | ----
2017011011 | AA | BB
2017011011 | CC | DD
2017011015 | PP | BB
2017011015 | QQ | DD
2017011016 | AA | BB
2017011016 | CC | DD
2017011017 | PP | BB
2017011017 | QQ | DD

SQLのような結果を得るためにフィルタリングするにはどうすればよいですか? select * from DF where dt> (select distinct dt from DF order by dt desc limit 3)

出力には最後の3つの日付があります

2017011015 | PP | BB
2017011015 | QQ | DD
2017011016 | AA | BB
2017011016 | CC | DD
2017011017 | PP | BB
2017011017 | QQ | DD

ありがとう
ホセイン

モタオ

Spark1.6.1でテスト済み

import sqlContext.implicit._
val df = sqlContext.createDataFrame(Seq(
  (2017011011, "AA", "BB"),
  (2017011011, "CC", "DD"),
  (2017011015, "PP", "BB"),
  (2017011015, "QQ", "DD"),
  (2017011016, "AA", "BB"),
  (2017011016, "CC", "DD"),
  (2017011017, "PP", "BB"),
  (2017011017, "QQ", "DD")
)).select(
  $"_1".as("DT"),
  $"_2".as("col1"),
  $"_3".as("col2")
) 

val dates = df.select($"DT")
  .distinct()
  .orderBy(-$"DT")
  .map(_.getInt(0))
  .take(3)

val result = df.filter(dates.map($"DT" === _).reduce(_ || _))
result.show()

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

このデータフレームを変換してセルにフィルターを適用するにはどうすればよいですか?

分類Dev

パンダのデータフレームで「決して」フィルターを作成するにはどうすればよいですか

分類Dev

別のデータフレームからデータフレームのセルの値を取得するにはどうすればよいですか

分類Dev

Sparkデータフレームの特定のフィールドにのみ「キューブ」を使用するにはどうすればよいですか?

分類Dev

複数の条件に応じてデータフレームに値を挿入するにはどうすればよいですか?論理的な問題

分類Dev

日付のデータフレームを特定の月/日でフィルタリングするにはどうすればよいですか?

分類Dev

行の位置でパンダのデータフレームをフィルタリングするにはどうすればよいですか?

分類Dev

パンダの行を別のデータフレーム列でフィルタリングするにはどうすればよいですか?

分類Dev

Rのデータフレーム内のリストの値をフィルタリングするにはどうすればよいですか?

分類Dev

他のデータフレームに基づいてフィルタリングするにはどうすればよいですか

分類Dev

データフレームを複数フィルタリングするための関数を作成するにはどうすればよいですか?

分類Dev

複数の列でデータフレームをフィルタリングするにはどうすればよいですか?

分類Dev

パンダデータフレームのインデックスフィールドを参照するにはどうすればよいですか?

分類Dev

pandasデータフレームの前後の行をフィルタリングするにはどうすればよいですか?

分類Dev

1つの列に整数があるデータフレームの行をフィルタリングするにはどうすればよいですか

分類Dev

データフレームでデルタを計算するにはどうすればよいですか?

分類Dev

パンダデータフレームの特定のフィールドの値を設定するにはどうすればよいですか?

分類Dev

データフレームのリストの特定のフィールドを変更するにはどうすればよいですか?

分類Dev

このデータフレームをフィルタリングするにはどうすればよいですか?

分類Dev

groupbyを使用してデータフレーム内の重複をフィルタリングするにはどうすればよいですか?

分類Dev

Pandasデータフレームの数値をフィルタリングするにはどうすればよいですか?

分類Dev

パンダのデータフレームをフィルタリングして特定の値を含めるにはどうすればよいですか?

分類Dev

Pythonのデータフレームでgroupbyを使用した後、データフレームをフィルタリングして特定のタイプのレコードを返すにはどうすればよいですか?

分類Dev

パンダデータフレームの重複フィールドを処理するにはどうすればよいですか?

分類Dev

このデータフレームから別のデータフレームに移動するためにpivot_longerを使用するにはどうすればよいですか?(さらにdtypeの問題)

分類Dev

レルムデータベースのスキーマにフィールドを追加するにはどうすればよいですか?

分類Dev

カスタム フォーム バリデーターのフィールドにエラーを表示するにはどうすればよいですか?

分類Dev

フォームフィールドにデータベースDjangoのデータを入力するにはどうすればよいですか?

分類Dev

別のデータフレームの値を使用して、データフレームのレコードにないものをフィルタリングするにはどうすればよいですか?

Related 関連記事

  1. 1

    このデータフレームを変換してセルにフィルターを適用するにはどうすればよいですか?

  2. 2

    パンダのデータフレームで「決して」フィルターを作成するにはどうすればよいですか

  3. 3

    別のデータフレームからデータフレームのセルの値を取得するにはどうすればよいですか

  4. 4

    Sparkデータフレームの特定のフィールドにのみ「キューブ」を使用するにはどうすればよいですか?

  5. 5

    複数の条件に応じてデータフレームに値を挿入するにはどうすればよいですか?論理的な問題

  6. 6

    日付のデータフレームを特定の月/日でフィルタリングするにはどうすればよいですか?

  7. 7

    行の位置でパンダのデータフレームをフィルタリングするにはどうすればよいですか?

  8. 8

    パンダの行を別のデータフレーム列でフィルタリングするにはどうすればよいですか?

  9. 9

    Rのデータフレーム内のリストの値をフィルタリングするにはどうすればよいですか?

  10. 10

    他のデータフレームに基づいてフィルタリングするにはどうすればよいですか

  11. 11

    データフレームを複数フィルタリングするための関数を作成するにはどうすればよいですか?

  12. 12

    複数の列でデータフレームをフィルタリングするにはどうすればよいですか?

  13. 13

    パンダデータフレームのインデックスフィールドを参照するにはどうすればよいですか?

  14. 14

    pandasデータフレームの前後の行をフィルタリングするにはどうすればよいですか?

  15. 15

    1つの列に整数があるデータフレームの行をフィルタリングするにはどうすればよいですか

  16. 16

    データフレームでデルタを計算するにはどうすればよいですか?

  17. 17

    パンダデータフレームの特定のフィールドの値を設定するにはどうすればよいですか?

  18. 18

    データフレームのリストの特定のフィールドを変更するにはどうすればよいですか?

  19. 19

    このデータフレームをフィルタリングするにはどうすればよいですか?

  20. 20

    groupbyを使用してデータフレーム内の重複をフィルタリングするにはどうすればよいですか?

  21. 21

    Pandasデータフレームの数値をフィルタリングするにはどうすればよいですか?

  22. 22

    パンダのデータフレームをフィルタリングして特定の値を含めるにはどうすればよいですか?

  23. 23

    Pythonのデータフレームでgroupbyを使用した後、データフレームをフィルタリングして特定のタイプのレコードを返すにはどうすればよいですか?

  24. 24

    パンダデータフレームの重複フィールドを処理するにはどうすればよいですか?

  25. 25

    このデータフレームから別のデータフレームに移動するためにpivot_longerを使用するにはどうすればよいですか?(さらにdtypeの問題)

  26. 26

    レルムデータベースのスキーマにフィールドを追加するにはどうすればよいですか?

  27. 27

    カスタム フォーム バリデーターのフィールドにエラーを表示するにはどうすればよいですか?

  28. 28

    フォームフィールドにデータベースDjangoのデータを入力するにはどうすればよいですか?

  29. 29

    別のデータフレームの値を使用して、データフレームのレコードにないものをフィルタリングするにはどうすればよいですか?

ホットタグ

アーカイブ