SparkデータフレームPythonでバイナリ文字列の列をintに変換します

助けて

したがって、次のような1つの列を持つデータフレームがあります。

+----------+
|some_colum|
+----------+
|        10|
|        00|
|        00|
|        10|
|        10|
|        00|
|        10|
|        00|
|        00|
|        10|
+----------+

ここで、some_colum列はバイナリ文字列です。

この列を10進数に変換したいと思います。

やってみた

data = data.withColumn("some_colum", int(col("some_colum"), 2))

しかし、これはうまくいかないようです。エラーが発生した場合:

int() can't convert non-string with explicit base

cast()はその仕事をすることができるかもしれないと思いますが、私はそれを理解することができません。何か案は?

ダミアン・マルティンス

int列に直接適用することできないと思います。udfで使用できます:

from org.apache.spark.sql import functions
binary_to_int = functions.udf(lambda x: int(x, 2), IntegerType())
data = data.withColumn("some_colum", binary_to_int("some_colum").alias('some_column_int'))

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

文字列バイナリを個々のビットに変換するpythonデータフレーム

分類Dev

値のデータフレームを、一意の各値が列であるバイナリデータフレームに変換します

分類Dev

2列のデータフレームを対称バイナリ行列に変換します

分類Dev

データフレーム文字列列をArray [Int]に変換します

分類Dev

データフレーム(Python)のエントリのバイトを文字列に変換する方法は?

分類Dev

csvデータフレームをインポートし、Pythonで文字列に変換します

分類Dev

文字列のパンダデータフレームをintのnumpy配列に変換します

分類Dev

複数の文字列のリストをPythonデータフレームに変換します

分類Dev

Pythonはラベル付きの文字列のリストでデータフレームを変換します

分類Dev

Sparkデータフレーム内のタイプMapTypeの列のデータを文字列に変換します

分類Dev

バイナリデータを含むbyte []を文字列に変換します

分類Dev

Pythonはリストをデータフレーム内の文字列に変換します

分類Dev

文字列列を持つsparkデータフレームをStructType列に変換します

分類Dev

文字列形式の科学的記数法をsparkデータフレームの数値に変換します

分類Dev

Pythonで1列のSparkデータフレームをピップライン文字で区切られた単一の文字列に変換する

分類Dev

データフレームの要素をバイナリデータに変換します

分類Dev

Pandasデータフレームで列タイプを文字列から日時形式に変換します

分類Dev

Excelでバイナリデータを文字列データに変換する

分類Dev

Pythonバイナリ文字列をバイナリintに変換します

分類Dev

Sparkのデータフレームの列でバイナリ「または」操作を実行する方法

分類Dev

データフレーム配列列を複数のバイナリ列に分割します[R]

分類Dev

データフレーム配列列を複数のバイナリ列に分割します[R]

分類Dev

Python:データフレームをリスト内の文字列アイテムを含むリストに変換します

分類Dev

pysparkデータフレームの列を小文字に変換します

分類Dev

データフレームの各行を文字列に変換します

分類Dev

Rでデータフレームの複数の列を文字列から数値に変換します

分類Dev

文字列の配列をデータフレーム列の整数の配列に変換します

分類Dev

pysparksqlデータフレームで文字列の列を辞書に変換します

分類Dev

Apache Spark:JSON文字列を含む列をScalaSparkの新しいデータフレームに変換する

Related 関連記事

  1. 1

    文字列バイナリを個々のビットに変換するpythonデータフレーム

  2. 2

    値のデータフレームを、一意の各値が列であるバイナリデータフレームに変換します

  3. 3

    2列のデータフレームを対称バイナリ行列に変換します

  4. 4

    データフレーム文字列列をArray [Int]に変換します

  5. 5

    データフレーム(Python)のエントリのバイトを文字列に変換する方法は?

  6. 6

    csvデータフレームをインポートし、Pythonで文字列に変換します

  7. 7

    文字列のパンダデータフレームをintのnumpy配列に変換します

  8. 8

    複数の文字列のリストをPythonデータフレームに変換します

  9. 9

    Pythonはラベル付きの文字列のリストでデータフレームを変換します

  10. 10

    Sparkデータフレーム内のタイプMapTypeの列のデータを文字列に変換します

  11. 11

    バイナリデータを含むbyte []を文字列に変換します

  12. 12

    Pythonはリストをデータフレーム内の文字列に変換します

  13. 13

    文字列列を持つsparkデータフレームをStructType列に変換します

  14. 14

    文字列形式の科学的記数法をsparkデータフレームの数値に変換します

  15. 15

    Pythonで1列のSparkデータフレームをピップライン文字で区切られた単一の文字列に変換する

  16. 16

    データフレームの要素をバイナリデータに変換します

  17. 17

    Pandasデータフレームで列タイプを文字列から日時形式に変換します

  18. 18

    Excelでバイナリデータを文字列データに変換する

  19. 19

    Pythonバイナリ文字列をバイナリintに変換します

  20. 20

    Sparkのデータフレームの列でバイナリ「または」操作を実行する方法

  21. 21

    データフレーム配列列を複数のバイナリ列に分割します[R]

  22. 22

    データフレーム配列列を複数のバイナリ列に分割します[R]

  23. 23

    Python:データフレームをリスト内の文字列アイテムを含むリストに変換します

  24. 24

    pysparkデータフレームの列を小文字に変換します

  25. 25

    データフレームの各行を文字列に変換します

  26. 26

    Rでデータフレームの複数の列を文字列から数値に変換します

  27. 27

    文字列の配列をデータフレーム列の整数の配列に変換します

  28. 28

    pysparksqlデータフレームで文字列の列を辞書に変換します

  29. 29

    Apache Spark:JSON文字列を含む列をScalaSparkの新しいデータフレームに変換する

ホットタグ

アーカイブ