Spark : DataFrame 열을 벡터로 변환

바니 로베 라

df이있는 DataFrame 이 있고 벡터 및 행렬 제품에서 사용할 수 있도록 벡터 (예 : a ) column로 변환 column하고 싶습니다 DenseVector.

주의 : 벡터 열이 필요하지 않습니다. 벡터 객체가 필요합니다.

어떻게하나요?

vectorAssembler함수 ( link )를 찾았 지만 일부 DataFrame 열을 여전히 DataFrame 열인 벡터 열로 변환하므로 도움이되지 않습니다. 내 원하는 출력은 대신 벡터 여야합니다.


이 질문의 목표에 대해 : 왜 DF 열을 벡터로 변환하려고합니까? 숫자 열이있는 DF가 있고 행렬과이 열 사이의 곱을 계산해야한다고 가정합니다. 어떻게하면 되나요? (DF 숫자 행에 대해서도 마찬가지입니다.) 모든 대체 접근 방식을 환영합니다.

user8889608

어떻게:

DenseVector(df.select("column_name").rdd.map(lambda x: x[0]).collect())

하지만 실제 시나리오에서는 말이되지 않습니다 .

Spark Vectors 는 분산되지 않으므로 데이터가 하나의 (드라이버) 노드의 메모리에 맞는 경우에만 적용됩니다. 이 경우 DataFrame처리에 Spark 사용하지 않을 것 입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Spark / scala를 사용하여 문자열을 DataFrame으로 변환

분류에서Dev

Scala에서 Spark의 DataFrame 열을 List [String]으로 변환

분류에서Dev

특징의 Spark 벡터를 배열로 변환

분류에서Dev

목록 열을 벡터 열로 변환

분류에서Dev

배열을 벡터로 변환

분류에서Dev

Spark에서 JavaPairInputDStream을 DataSet / DataFrame으로 변환하는 방법

분류에서Dev

Spark SQL- RelationalGroupedDataSet을 DataFrame으로 변환하는 방법

분류에서Dev

Spark Dataframe API에서 생년월일을 나이로 변환

분류에서Dev

스칼라에서 Spark Dataframe을 RDD로 변환

분류에서Dev

Spark Dataframe (with WrappedArray)을 스칼라의 RDD [labelPoint]로 변환

분류에서Dev

Clojure에서 벡터 맵을 열 벡터로 변환

분류에서Dev

Scala 열의 16 진수 하위 문자열을 10 진수로 변환-Dataframe org.apache.spark.sql.catalyst.parser.ParseException :

분류에서Dev

Numpy 배열을 Pandas DataFrame으로 변환

분류에서Dev

DataFrame 열을 요인으로 변환

분류에서Dev

DataFrame 열을 쌍 목록으로 변환

분류에서Dev

Spark Scala를 사용하여 하나의 열 데이터를 벡터로 변환하는 방법

분류에서Dev

벡터를 배열로 변환

분류에서Dev

문자열 열이있는 Spark 데이터 프레임을 StructType 열로 변환

분류에서Dev

Spark-JAVA에서 MultiMap을 DataFrame으로 변환 할 수 있습니까?

분류에서Dev

Spark에서 Dataframe을 케이스 클래스의 RDD로 다시 변환

분류에서Dev

Ruby 배열을 R 배열 또는 벡터로 변환

분류에서Dev

Rcpp : 행렬을 벡터로 변환

분류에서Dev

Julia-행렬을 벡터로 변환

분류에서Dev

Rcpp : 행렬을 벡터로 변환

분류에서Dev

줄리아 : 행 벡터를 열 벡터로 변환

분류에서Dev

Pandas DataFrame을 dictionairy로 변환

분류에서Dev

SequenceFile을 DataFrame으로 변환

분류에서Dev

특징의 Spark 배열을 평면 배열로 변환

분류에서Dev

Spark DataFrame은 문자열 형식의 밀리 초 타임 스탬프 열을 사람이 읽을 수있는 시간 (밀리 초)으로 변환합니다.

Related 관련 기사

  1. 1

    Spark / scala를 사용하여 문자열을 DataFrame으로 변환

  2. 2

    Scala에서 Spark의 DataFrame 열을 List [String]으로 변환

  3. 3

    특징의 Spark 벡터를 배열로 변환

  4. 4

    목록 열을 벡터 열로 변환

  5. 5

    배열을 벡터로 변환

  6. 6

    Spark에서 JavaPairInputDStream을 DataSet / DataFrame으로 변환하는 방법

  7. 7

    Spark SQL- RelationalGroupedDataSet을 DataFrame으로 변환하는 방법

  8. 8

    Spark Dataframe API에서 생년월일을 나이로 변환

  9. 9

    스칼라에서 Spark Dataframe을 RDD로 변환

  10. 10

    Spark Dataframe (with WrappedArray)을 스칼라의 RDD [labelPoint]로 변환

  11. 11

    Clojure에서 벡터 맵을 열 벡터로 변환

  12. 12

    Scala 열의 16 진수 하위 문자열을 10 진수로 변환-Dataframe org.apache.spark.sql.catalyst.parser.ParseException :

  13. 13

    Numpy 배열을 Pandas DataFrame으로 변환

  14. 14

    DataFrame 열을 요인으로 변환

  15. 15

    DataFrame 열을 쌍 목록으로 변환

  16. 16

    Spark Scala를 사용하여 하나의 열 데이터를 벡터로 변환하는 방법

  17. 17

    벡터를 배열로 변환

  18. 18

    문자열 열이있는 Spark 데이터 프레임을 StructType 열로 변환

  19. 19

    Spark-JAVA에서 MultiMap을 DataFrame으로 변환 할 수 있습니까?

  20. 20

    Spark에서 Dataframe을 케이스 클래스의 RDD로 다시 변환

  21. 21

    Ruby 배열을 R 배열 또는 벡터로 변환

  22. 22

    Rcpp : 행렬을 벡터로 변환

  23. 23

    Julia-행렬을 벡터로 변환

  24. 24

    Rcpp : 행렬을 벡터로 변환

  25. 25

    줄리아 : 행 벡터를 열 벡터로 변환

  26. 26

    Pandas DataFrame을 dictionairy로 변환

  27. 27

    SequenceFile을 DataFrame으로 변환

  28. 28

    특징의 Spark 배열을 평면 배열로 변환

  29. 29

    Spark DataFrame은 문자열 형식의 밀리 초 타임 스탬프 열을 사람이 읽을 수있는 시간 (밀리 초)으로 변환합니다.

뜨겁다태그

보관