pyspark는 상수 배열을 데이터 프레임에 열로 추가하는 것과 같습니다.

스택 0114106

아래 코드는 scala-spark에서 작동합니다.

scala> val ar = Array("oracle","java")
ar: Array[String] = Array(oracle, java)

scala> df.withColumn("tags",lit(ar)).show(false)
+------+---+----------+----------+--------------+
|name  |age|role      |experience|tags          |
+------+---+----------+----------+--------------+
|John  |25 |Developer |2.56      |[oracle, java]|
|Scott |30 |Tester    |5.2       |[oracle, java]|
|Jim   |28 |DBA       |3.0       |[oracle, java]|
|Mike  |35 |Consultant|10.0      |[oracle, java]|
|Daniel|26 |Developer |3.2       |[oracle, java]|
|Paul  |29 |Tester    |3.6       |[oracle, java]|
|Peter |30 |Developer |6.5       |[oracle, java]|
+------+---+----------+----------+--------------+


scala>

pyspark에서 동일한 동작을 어떻게 얻습니까? 아래에서 시도했지만 작동하지 않고 Java 오류가 발생합니다.

>>> from pyspark.sql.types import *

>>> tag=["oracle","java"]
>>> df2.withColumn("tags",lit(tag)).show()

오류

: java.lang.RuntimeException: Unsupported literal type class java.util.ArrayList [oracle, java]
로프

함수 모듈에서 배열을 가져올 수 있습니다.

>>> from pyspark.sql.types import *
>>> from pyspark.sql.functions import array

>>> tag=array(lit("oracle"),lit("java")
>>> df2.withColumn("tags",tag).show()

아래에서 테스트

>>> from pyspark.sql.functions import array

>>> tag=array(lit("oracle"),lit("java"))
>>> 
>>> ranked.withColumn("tag",tag).show()
+------+--------------+----------+-----+----+----+--------------+               
|gender|    ethinicity|first_name|count|rank|year|           tag|
+------+--------------+----------+-----+----+----+--------------+
|  MALE|      HISPANIC|    JAYDEN|  364|   1|2012|[oracle, java]|
|  MALE|WHITE NON HISP|    JOSEPH|  300|   2|2012|[oracle, java]|
|  MALE|WHITE NON HISP|    JOSEPH|  300|   2|2012|[oracle, java]|
|  MALE|      HISPANIC|     JACOB|  293|   4|2012|[oracle, java]|
|  MALE|      HISPANIC|     JACOB|  293|   4|2012|[oracle, java]|
|  MALE|WHITE NON HISP|     DAVID|  289|   6|2012|[oracle, java]|
|  MALE|WHITE NON HISP|     DAVID|  289|   6|2012|[oracle, java]|
|  MALE|      HISPANIC|   MATTHEW|  279|   8|2012|[oracle, java]|
|  MALE|      HISPANIC|   MATTHEW|  279|   8|2012|[oracle, java]|
|  MALE|      HISPANIC|     ETHAN|  254|  10|2012|[oracle, java]|
|  MALE|      HISPANIC|     ETHAN|  254|  10|2012|[oracle, java]|
|  MALE|WHITE NON HISP|   MICHAEL|  245|  12|2012|[oracle, java]|
|  MALE|WHITE NON HISP|   MICHAEL|  245|  12|2012|[oracle, java]|
|  MALE|WHITE NON HISP|     JACOB|  242|  14|2012|[oracle, java]|
|  MALE|WHITE NON HISP|     JACOB|  242|  14|2012|[oracle, java]|
|  MALE|WHITE NON HISP|     MOSHE|  238|  16|2012|[oracle, java]|
|  MALE|WHITE NON HISP|     MOSHE|  238|  16|2012|[oracle, java]|
|  MALE|      HISPANIC|     ANGEL|  236|  18|2012|[oracle, java]|
|  MALE|      HISPANIC|     AIDEN|  235|  19|2012|[oracle, java]|
|  MALE|WHITE NON HISP|    DANIEL|  232|  20|2012|[oracle, java]|
+------+--------------+----------+-----+----+----+--------------+
only showing top 20 rows

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

함수에서 열을 호출하는 것이 Pandas 데이터 프레임의 외부에서 열을 호출하는 것과 어떻게 다른가요?

분류에서Dev

데이터 프레임 열의 값을 반복하는 것과 열의 데이터에 변수를 할당하는 것의 차이점은 무엇입니까?

분류에서Dev

Python을 사용하여 다른 데이터 프레임의 열과 상수가있는 데이터 프레임 추가

분류에서Dev

Python : "vlookup"과 일치하는 다른 데이터 프레임에 열 추가

분류에서Dev

Python의 데이터 프레임에서 스타일을 업데이트 할 수없는 것 같습니다.

분류에서Dev

데이터 프레임에 Numpy 배열을 추가하는 Datframe

분류에서Dev

pyspark 데이터 프레임에 데이터가있는 열 수를 찾는 방법이 있습니까?

분류에서Dev

데이터 프레임에 열 추가-열을 tibble로 표시하지만 데이터 프레임에는 표시하지 않습니다.

분류에서Dev

R 데이터 프레임에서 열을 계산하는 동안 이상한 결과가 발생합니까?

분류에서Dev

pyspark는 pyspark 데이터 프레임에 열을 복제합니다.

분류에서Dev

ValueError : 데이터 프레임에서 X와 Y를 추출 할 때 코드는 배열과 같은 정수 여야합니다.

분류에서Dev

데이터 프레임에 % 열을 추가하는 R과 유사한 방법

분류에서Dev

다른 열을 기반으로 pyspark 데이터 프레임에 새 열 추가

분류에서Dev

외부 데이터 프레임에서 데이터를 검색하는 수식을 기반으로 열을 추가하는 방법은 무엇입니까?

분류에서Dev

Pandas를 사용하여 날짜 열과 일 수 열을 기반으로 데이터 프레임에 행을 추가하는 방법

분류에서Dev

R의 열별로 빈 데이터 프레임 열에 열을 추가하는 방법은 무엇입니까?

분류에서Dev

데이터 프레임을 반올림하는 것은 문자열과 부동 소수점 둘 다로 구성됩니다.

분류에서Dev

R의 데이터 프레임에 총 개수 열을 추가하는 방법

분류에서Dev

Pandas 데이터 프레임에 열 수준을 추가하는 방법

분류에서Dev

데이터 프레임의 단일 행을 1x1과 일치하는 많은 다른 데이터 세트에 열로 추가

분류에서Dev

pandas 데이터 프레임을 다른 pandas 데이터 프레임에 저장하는 것이 지원되어야합니까? 더 이상 이러한 데이터 프레임을 표시 할 수 없습니다. 이것은 버그입니까?

분류에서Dev

R bu에서 몇 개의 열을 추출하여 데이터 프레임을 부분 설정하는 방법 및 simmilar 열을 기반으로 한 데이터 프레임에서 다른 데이터 프레임으로 열을 추가하는 방법

분류에서Dev

Pyspark의 동일한 데이터 프레임에있는 다른 열의 정규식 값으로 데이터 프레임의 열을 필터링하는 방법

분류에서Dev

다중 발생을 처리하는 다른 열을 기반으로 데이터 프레임에 열 추가

분류에서Dev

스피너에 동적 데이터 (문자열 배열과 같은 것)를 추가하는 방법

분류에서Dev

다른 데이터 프레임에서 가져온 값으로 데이터 프레임에 새 열을 추가하는 방법은 무엇입니까?

분류에서Dev

100 개 이상의 PySpark 데이터 프레임을 다른 열과 함께 결합하는 더 쉬운 방법이 있습니까 (병합이 아니라 추가)

분류에서Dev

Pandas-데이터 프레임의 일부 값과 일치하는 계열 색인을 기반으로 계열의 값을 데이터 프레임 열에 추가합니다.

분류에서Dev

pyspark는 데이터 프레임을 구조체 열과 결합

Related 관련 기사

  1. 1

    함수에서 열을 호출하는 것이 Pandas 데이터 프레임의 외부에서 열을 호출하는 것과 어떻게 다른가요?

  2. 2

    데이터 프레임 열의 값을 반복하는 것과 열의 데이터에 변수를 할당하는 것의 차이점은 무엇입니까?

  3. 3

    Python을 사용하여 다른 데이터 프레임의 열과 상수가있는 데이터 프레임 추가

  4. 4

    Python : "vlookup"과 일치하는 다른 데이터 프레임에 열 추가

  5. 5

    Python의 데이터 프레임에서 스타일을 업데이트 할 수없는 것 같습니다.

  6. 6

    데이터 프레임에 Numpy 배열을 추가하는 Datframe

  7. 7

    pyspark 데이터 프레임에 데이터가있는 열 수를 찾는 방법이 있습니까?

  8. 8

    데이터 프레임에 열 추가-열을 tibble로 표시하지만 데이터 프레임에는 표시하지 않습니다.

  9. 9

    R 데이터 프레임에서 열을 계산하는 동안 이상한 결과가 발생합니까?

  10. 10

    pyspark는 pyspark 데이터 프레임에 열을 복제합니다.

  11. 11

    ValueError : 데이터 프레임에서 X와 Y를 추출 할 때 코드는 배열과 같은 정수 여야합니다.

  12. 12

    데이터 프레임에 % 열을 추가하는 R과 유사한 방법

  13. 13

    다른 열을 기반으로 pyspark 데이터 프레임에 새 열 추가

  14. 14

    외부 데이터 프레임에서 데이터를 검색하는 수식을 기반으로 열을 추가하는 방법은 무엇입니까?

  15. 15

    Pandas를 사용하여 날짜 열과 일 수 열을 기반으로 데이터 프레임에 행을 추가하는 방법

  16. 16

    R의 열별로 빈 데이터 프레임 열에 열을 추가하는 방법은 무엇입니까?

  17. 17

    데이터 프레임을 반올림하는 것은 문자열과 부동 소수점 둘 다로 구성됩니다.

  18. 18

    R의 데이터 프레임에 총 개수 열을 추가하는 방법

  19. 19

    Pandas 데이터 프레임에 열 수준을 추가하는 방법

  20. 20

    데이터 프레임의 단일 행을 1x1과 일치하는 많은 다른 데이터 세트에 열로 추가

  21. 21

    pandas 데이터 프레임을 다른 pandas 데이터 프레임에 저장하는 것이 지원되어야합니까? 더 이상 이러한 데이터 프레임을 표시 할 수 없습니다. 이것은 버그입니까?

  22. 22

    R bu에서 몇 개의 열을 추출하여 데이터 프레임을 부분 설정하는 방법 및 simmilar 열을 기반으로 한 데이터 프레임에서 다른 데이터 프레임으로 열을 추가하는 방법

  23. 23

    Pyspark의 동일한 데이터 프레임에있는 다른 열의 정규식 값으로 데이터 프레임의 열을 필터링하는 방법

  24. 24

    다중 발생을 처리하는 다른 열을 기반으로 데이터 프레임에 열 추가

  25. 25

    스피너에 동적 데이터 (문자열 배열과 같은 것)를 추가하는 방법

  26. 26

    다른 데이터 프레임에서 가져온 값으로 데이터 프레임에 새 열을 추가하는 방법은 무엇입니까?

  27. 27

    100 개 이상의 PySpark 데이터 프레임을 다른 열과 함께 결합하는 더 쉬운 방법이 있습니까 (병합이 아니라 추가)

  28. 28

    Pandas-데이터 프레임의 일부 값과 일치하는 계열 색인을 기반으로 계열의 값을 데이터 프레임 열에 추가합니다.

  29. 29

    pyspark는 데이터 프레임을 구조체 열과 결합

뜨겁다태그

보관