Spark 데이터 프레임 또는 SQL에서 선호 계층 구조가있는 다중 레코드 선택

아제이 파틸

카테고리가 다른 동일한 제품의 제품 데이터 프레임이 있습니다. 같은 계층 구조를 기반으로 하나의 레코드 만 선택하고 싶습니다.

Product ID.  Category.  Status
1.           Cat1.      status1
1.           Cat2.      status1
1.           Cat3.      status1
2.           Cat1.      status1
2.           Cat2.      status1
3.           Cat2.      status1

Cat1이있는 레코드가 있으면 선택하고 그렇지 않으면 Cat2를 선택합니다. Cat2가 없으면 Cat3을 선택하십시오. 그러나 여러 개 중 하나만 선택하십시오.

아제이 파틸

Yogesh와 Lamansa의 답변을 사용하여 아래 솔루션을 개발했습니다.

 val df1 = df.withColum("row_num", when($"category"==="Cat1", "A"),
    .when($"category" ==== "Cat2", "B"),
    .when($"category" === "Cat3", "C"))

    df1.join(df1.groupBy("product_id).agg(first("category").as("category")), 
    Seq("product_id","category")).show

카테고리 별 주문으로 사용되는 경우 선호도가 원하는 순서로되어 있는지 확인할 수 없습니다. 예를 들어 Cat2가 첫 번째 선호 사항이 될 수 있습니다.

Output :
+----------+--------+-------+
|Product ID|Category| Status|
+----------+--------+-------+
|         1|    Cat1|status1|
|         2|    Cat1|status1|
|         3|    Cat2|status1|
+----------+--------+-------+

출력 :

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

데이터 프레임에서 집계 된 열을 선택하는 방법

분류에서Dev

Spark / Scala- 데이터 프레임에서 조건부로 열 선택

분류에서Dev

데이터 프레임에서 특정 행만 선택하는 관용적 방법 (다른 데이터 프레임에 인덱스가 있음)

분류에서Dev

키-> 열 이름이있는 맵을 사용하여 데이터 프레임에서 선택 열을 Spark합니다.

분류에서Dev

r에서 16 일마다 행 데이터를 선택하는 서브 세트 데이터 프레임 베이

분류에서Dev

Pandas에서 다른 데이터 프레임의 열 이름에 행 이름이있는 경우 데이터 프레임의 행 값을 선택합니다.

분류에서Dev

날짜가있는 Pandas 데이터 프레임에서 행 선택

분류에서Dev

모든 필드를 선택하여 구조체에서 최대 값 얻기 Spark 데이터 프레임

분류에서Dev

data.tree가있는 R의 데이터 프레임에서 "NA"없이 제품 계층 구조 트리를 만들고 인쇄합니다.

분류에서Dev

목록으로 여러 조건이있는 데이터 프레임 레코드 선택

분류에서Dev

Pandas의 다중 열에 따라 데이터 프레임을 빠르게 선택하는 방법

분류에서Dev

Panda 데이터 프레임과 Dask 데이터 프레임에서 선택한 열만 계산하고 계산하는 방법은 무엇입니까?

분류에서Dev

규칙에 따라 중복 레코드 선택 또는 삭제

분류에서Dev

R : x 및 y 인덱스의 벡터가있는 행렬 또는 데이터 프레임에서 값으로 구성된 벡터 선택

분류에서Dev

Julia 데이터 프레임에서 누락 된 값이있는 행 선택

분류에서Dev

선택한 행에 대한 Spark 데이터 프레임 작업

분류에서Dev

중복이있는 경우 최신 레코드 만 선택하는 SQL (SCCM 데이터베이스)의 쿼리

분류에서Dev

열이 목록의 값 중 하나를 사용하지 않는 데이터 프레임에서 행 선택

분류에서Dev

모든 항목이 목록에있는 일대 다 관계가있는 레코드 선택

분류에서Dev

다른 데이터 프레임에없는 레코드 식별

분류에서Dev

다양한 수의 조건으로 데이터 프레임에서 행 선택

분류에서Dev

데이터 프레임에서 중복 라인을 선택하는 방법은 무엇입니까?

분류에서Dev

R에서는 메뉴에서 데이터 프레임을 선택하고 bind_rows를 사용합니다.

분류에서Dev

최대 수 (및 최대 레코딩) 만 선택하고 데이터 프레임에서 나머지는 비워두고 여러 변수가있는 여러 조건으로 레코딩합니다.

분류에서Dev

R에서 행 또는 열의 범주에 따라 데이터 프레임의 요소 선택

분류에서Dev

동일한 이름의 열 선택이있는 다른 데이터 프레임을 사용하여 데이터 프레임 열 선택 변경

분류에서Dev

조건이 r 인 데이터 프레임 행에서 선택

분류에서Dev

인덱스가 동일한 다른 데이터 프레임에서 값 선택

분류에서Dev

그룹에 대한 최소값이있는 데이터 프레임의 모든 행을 선택합니다.

Related 관련 기사

  1. 1

    데이터 프레임에서 집계 된 열을 선택하는 방법

  2. 2

    Spark / Scala- 데이터 프레임에서 조건부로 열 선택

  3. 3

    데이터 프레임에서 특정 행만 선택하는 관용적 방법 (다른 데이터 프레임에 인덱스가 있음)

  4. 4

    키-> 열 이름이있는 맵을 사용하여 데이터 프레임에서 선택 열을 Spark합니다.

  5. 5

    r에서 16 일마다 행 데이터를 선택하는 서브 세트 데이터 프레임 베이

  6. 6

    Pandas에서 다른 데이터 프레임의 열 이름에 행 이름이있는 경우 데이터 프레임의 행 값을 선택합니다.

  7. 7

    날짜가있는 Pandas 데이터 프레임에서 행 선택

  8. 8

    모든 필드를 선택하여 구조체에서 최대 값 얻기 Spark 데이터 프레임

  9. 9

    data.tree가있는 R의 데이터 프레임에서 "NA"없이 제품 계층 구조 트리를 만들고 인쇄합니다.

  10. 10

    목록으로 여러 조건이있는 데이터 프레임 레코드 선택

  11. 11

    Pandas의 다중 열에 따라 데이터 프레임을 빠르게 선택하는 방법

  12. 12

    Panda 데이터 프레임과 Dask 데이터 프레임에서 선택한 열만 계산하고 계산하는 방법은 무엇입니까?

  13. 13

    규칙에 따라 중복 레코드 선택 또는 삭제

  14. 14

    R : x 및 y 인덱스의 벡터가있는 행렬 또는 데이터 프레임에서 값으로 구성된 벡터 선택

  15. 15

    Julia 데이터 프레임에서 누락 된 값이있는 행 선택

  16. 16

    선택한 행에 대한 Spark 데이터 프레임 작업

  17. 17

    중복이있는 경우 최신 레코드 만 선택하는 SQL (SCCM 데이터베이스)의 쿼리

  18. 18

    열이 목록의 값 중 하나를 사용하지 않는 데이터 프레임에서 행 선택

  19. 19

    모든 항목이 목록에있는 일대 다 관계가있는 레코드 선택

  20. 20

    다른 데이터 프레임에없는 레코드 식별

  21. 21

    다양한 수의 조건으로 데이터 프레임에서 행 선택

  22. 22

    데이터 프레임에서 중복 라인을 선택하는 방법은 무엇입니까?

  23. 23

    R에서는 메뉴에서 데이터 프레임을 선택하고 bind_rows를 사용합니다.

  24. 24

    최대 수 (및 최대 레코딩) 만 선택하고 데이터 프레임에서 나머지는 비워두고 여러 변수가있는 여러 조건으로 레코딩합니다.

  25. 25

    R에서 행 또는 열의 범주에 따라 데이터 프레임의 요소 선택

  26. 26

    동일한 이름의 열 선택이있는 다른 데이터 프레임을 사용하여 데이터 프레임 열 선택 변경

  27. 27

    조건이 r 인 데이터 프레임 행에서 선택

  28. 28

    인덱스가 동일한 다른 데이터 프레임에서 값 선택

  29. 29

    그룹에 대한 최소값이있는 데이터 프레임의 모든 행을 선택합니다.

뜨겁다태그

보관