Spark : 두 데이터 프레임의 열 일치

Nareshbabral

다음과 같은 형식의 데이터 프레임이 있습니다.

+---+---+------+---+
| sp|sp2|colour|sp3|
+---+---+------+---+
|  0|  1|     1|  0|
|  1|  0|     0|  1|
|  0|  0|     1|  0|
+---+---+------+---+

다른 데이터 프레임은 첫 번째 데이터 프레임의 각 열에 대한 계수를 포함합니다. 예를 들면

+------+------+---------+------+
| CE_sp|CE_sp2|CE_colour|CE_sp3|
+------+------+---------+------+
|  0.94|  0.31|     0.11|  0.72|
+------+------+---------+------+

이제 두 번째 데이터 프레임의 점수를 추가하여 계산되는 첫 번째 데이터 프레임에 열을 추가하고 싶습니다.

예를 들어.

+---+---+------+---+-----+
| sp|sp2|colour|sp3|Score|
+---+---+------+---+-----+
|  0|  1|     1|  0| 0.42|
|  1|  0|     0|  1| 1.66|
|  0|  0|     1|  0| 0.11|
+---+---+------+---+-----+

r -> row of first dataframe
score = r(0)*CE_sp + r(1)*CE_sp2 + r(2)*CE_colour + r(3)*CE_sp3

n 개의 열이있을 수 있으며 열의 순서는 다를 수 있습니다.

미리 감사드립니다 !!!

제로 323

빠르고 간단합니다.

import org.apache.spark.sql.functions.col

val df = Seq(
  (0, 1, 1, 0), (1, 0, 0, 1), (0, 0, 1, 0)
).toDF("sp","sp2", "colour", "sp3")

val coefs = Map("sp" -> 0.94, "sp2" -> 0.32, "colour" -> 0.11, "sp3" -> 0.72)
val score = df.columns.map(
  c => col(c) * coefs.getOrElse(c, 0.0)).reduce(_ + _)

df.withColumn("score", score)

PySpark에서도 마찬가지입니다.

from pyspark.sql.functions import col

df = sc.parallelize([
    (0, 1, 1, 0), (1, 0, 0, 1), (0, 0, 1, 0)
]).toDF(["sp","sp2", "colour", "sp3"])

coefs = {"sp": 0.94, "sp2": 0.32, "colour": 0.11, "sp3": 0.72}
df.withColumn("score", sum(col(c) * coefs.get(c, 0) for c in df.columns))

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

R-두 데이터 프레임의 두 열 일치

분류에서Dev

열이 다른 두 Spark 데이터 프레임의 결합

분류에서Dev

R의 두 데이터 프레임 열간에 일치하는 값 벡터화

분류에서Dev

두 번째 데이터 프레임에서 일치하는 키를 기반으로 Spark 데이터 프레임 열에 목록 추가

분류에서Dev

R : 서로 다른 데이터 프레임의 두 열 일치, 배수 출력

분류에서Dev

두 데이터 프레임의 열이 동일한 데이터 프레임의 열 값 할당

분류에서Dev

일치하는 열에서 두 데이터 프레임 결합

분류에서Dev

동일한 데이터 프레임의 두 열 빼기

분류에서Dev

setdiff 두 개의 단일 열 데이터 프레임

분류에서Dev

두 개의 데이터 프레임을 여러 열과 일치시키고 일치 후 열 추가

분류에서Dev

Pandas에서 서로 다른 두 데이터 프레임의 열을 일치시켜 한 데이터 프레임의 열을 업데이트하는 방법

분류에서Dev

부분 문자열 일치를 기반으로 두 데이터 프레임의 두 열 비교

분류에서Dev

두 데이터 프레임의 두 기존 열 간의 일치를 기반으로 주파수 추가

분류에서Dev

두 데이터 프레임, pandas에서 두 개의 동일한 열 결합

분류에서Dev

세 번째 데이터 프레임의 일치 값을 기반으로 새로운 부울 열이있는 두 데이터 프레임의 곱

분류에서Dev

두 열 조합의 일치를 기반으로 한 데이터 프레임에서 다른 데이터 프레임으로 열 복사

분류에서Dev

R-두 번째 데이터 프레임의 열을 일치시켜 데이터 프레임에서 선택한 열을 곱합니다.

분류에서Dev

두 번째 데이터 프레임에 일치하는 값이있는 경우 데이터 프레임 열의 값을 바꿉니다.

분류에서Dev

두 열의 문자열 일치를 기반으로하는 부분 집합 R 데이터 프레임

분류에서Dev

R의 서로 다른 데이터 프레임에있는 두 열 쌍의 값 일치

분류에서Dev

두 열의 기준과 일치하는 데이터 프레임의 행만 반환합니다.

분류에서Dev

두 열의 값 범위를 기준으로 데이터 프레임의 행 일치

분류에서Dev

두 열의 값이 R에서 일치하지 않는 데이터 프레임에서 행 제거

분류에서Dev

두 데이터 프레임 간의 일대일 열 값 비교-Pandas

분류에서Dev

Pandas 데이터 프레임의 두 열을 목록 목록으로 펼치기

분류에서Dev

Spark Scala 데이터 프레임에서 일부 특정 열의 최대 값

분류에서Dev

R의 일부 문자로 두 데이터 프레임 일치

분류에서Dev

Spark 데이터 프레임에서 두 열의 차이 찾기 및 새 열에 추가

분류에서Dev

두 데이터 프레임간에 일치하는 열 값 연결

Related 관련 기사

  1. 1

    R-두 데이터 프레임의 두 열 일치

  2. 2

    열이 다른 두 Spark 데이터 프레임의 결합

  3. 3

    R의 두 데이터 프레임 열간에 일치하는 값 벡터화

  4. 4

    두 번째 데이터 프레임에서 일치하는 키를 기반으로 Spark 데이터 프레임 열에 목록 추가

  5. 5

    R : 서로 다른 데이터 프레임의 두 열 일치, 배수 출력

  6. 6

    두 데이터 프레임의 열이 동일한 데이터 프레임의 열 값 할당

  7. 7

    일치하는 열에서 두 데이터 프레임 결합

  8. 8

    동일한 데이터 프레임의 두 열 빼기

  9. 9

    setdiff 두 개의 단일 열 데이터 프레임

  10. 10

    두 개의 데이터 프레임을 여러 열과 일치시키고 일치 후 열 추가

  11. 11

    Pandas에서 서로 다른 두 데이터 프레임의 열을 일치시켜 한 데이터 프레임의 열을 업데이트하는 방법

  12. 12

    부분 문자열 일치를 기반으로 두 데이터 프레임의 두 열 비교

  13. 13

    두 데이터 프레임의 두 기존 열 간의 일치를 기반으로 주파수 추가

  14. 14

    두 데이터 프레임, pandas에서 두 개의 동일한 열 결합

  15. 15

    세 번째 데이터 프레임의 일치 값을 기반으로 새로운 부울 열이있는 두 데이터 프레임의 곱

  16. 16

    두 열 조합의 일치를 기반으로 한 데이터 프레임에서 다른 데이터 프레임으로 열 복사

  17. 17

    R-두 번째 데이터 프레임의 열을 일치시켜 데이터 프레임에서 선택한 열을 곱합니다.

  18. 18

    두 번째 데이터 프레임에 일치하는 값이있는 경우 데이터 프레임 열의 값을 바꿉니다.

  19. 19

    두 열의 문자열 일치를 기반으로하는 부분 집합 R 데이터 프레임

  20. 20

    R의 서로 다른 데이터 프레임에있는 두 열 쌍의 값 일치

  21. 21

    두 열의 기준과 일치하는 데이터 프레임의 행만 반환합니다.

  22. 22

    두 열의 값 범위를 기준으로 데이터 프레임의 행 일치

  23. 23

    두 열의 값이 R에서 일치하지 않는 데이터 프레임에서 행 제거

  24. 24

    두 데이터 프레임 간의 일대일 열 값 비교-Pandas

  25. 25

    Pandas 데이터 프레임의 두 열을 목록 목록으로 펼치기

  26. 26

    Spark Scala 데이터 프레임에서 일부 특정 열의 최대 값

  27. 27

    R의 일부 문자로 두 데이터 프레임 일치

  28. 28

    Spark 데이터 프레임에서 두 열의 차이 찾기 및 새 열에 추가

  29. 29

    두 데이터 프레임간에 일치하는 열 값 연결

뜨겁다태그

보관