SparkデータフレームPythonでバイナリ文字列の列をintに変換します

助けて

したがって、次のような1つの列を持つデータフレームがあります。

+----------+
|some_colum|
+----------+
|        10|
|        00|
|        00|
|        10|
|        10|
|        00|
|        10|
|        00|
|        00|
|        10|
+----------+

ここで、some_colum列はバイナリ文字列です。

この列を10進数に変換したいと思います。

やってみた

data = data.withColumn("some_colum", int(col("some_colum"), 2))

しかし、これはうまくいかないようです。エラーが発生した場合:

int() can't convert non-string with explicit base

cast()はその仕事をすることができるかもしれないと思いますが、私はそれを理解することができません。何か案は?

ダミアン・マルティンス

int列に直接適用することできないと思います。udfで使用できます:

from org.apache.spark.sql import functions
binary_to_int = functions.udf(lambda x: int(x, 2), IntegerType())
data = data.withColumn("some_colum", binary_to_int("some_colum").alias('some_column_int'))

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

バイナリデータを含むbyte []を文字列に変換します

分類Dev

Python:データフレームをリスト内の文字列アイテムを含むリストに変換します

分類Dev

pysparkデータフレームの列を小文字に変換します

分類Dev

Sparkのデータフレームの列でバイナリ「または」操作を実行する方法

分類Dev

データフレームの要素をバイナリデータに変換します

分類Dev

文字列バイナリを個々のビットに変換するpythonデータフレーム

分類Dev

Apache Spark:JSON文字列を含む列をScalaSparkの新しいデータフレームに変換する

分類Dev

Rでデータフレームの複数の列を文字列から数値に変換します

分類Dev

2列のデータフレームを対称バイナリ行列に変換します

分類Dev

データフレームの各行を文字列に変換します

分類Dev

文字列形式の科学的記数法をsparkデータフレームの数値に変換します

分類Dev

Pythonはラベル付きの文字列のリストでデータフレームを変換します

分類Dev

データフレーム文字列列をArray [Int]に変換します

分類Dev

Pythonはリストをデータフレーム内の文字列に変換します

分類Dev

複数の文字列のリストをPythonデータフレームに変換します

分類Dev

データフレーム配列列を複数のバイナリ列に分割します[R]

分類Dev

データフレーム配列列を複数のバイナリ列に分割します[R]

分類Dev

文字列列を持つsparkデータフレームをStructType列に変換します

分類Dev

pysparksqlデータフレームで文字列の列を辞書に変換します

分類Dev

Sparkデータフレーム内のタイプMapTypeの列のデータを文字列に変換します

分類Dev

文字列の配列をデータフレーム列の整数の配列に変換します

分類Dev

データフレーム(Python)のエントリのバイトを文字列に変換する方法は?

分類Dev

Pandasデータフレームで列タイプを文字列から日時形式に変換します

分類Dev

Excelでバイナリデータを文字列データに変換する

分類Dev

csvデータフレームをインポートし、Pythonで文字列に変換します

分類Dev

値のデータフレームを、一意の各値が列であるバイナリデータフレームに変換します

分類Dev

Pythonで1列のSparkデータフレームをピップライン文字で区切られた単一の文字列に変換する

分類Dev

Pythonバイナリ文字列をバイナリintに変換します

分類Dev

文字列のパンダデータフレームをintのnumpy配列に変換します

Related 関連記事

  1. 1

    バイナリデータを含むbyte []を文字列に変換します

  2. 2

    Python:データフレームをリスト内の文字列アイテムを含むリストに変換します

  3. 3

    pysparkデータフレームの列を小文字に変換します

  4. 4

    Sparkのデータフレームの列でバイナリ「または」操作を実行する方法

  5. 5

    データフレームの要素をバイナリデータに変換します

  6. 6

    文字列バイナリを個々のビットに変換するpythonデータフレーム

  7. 7

    Apache Spark:JSON文字列を含む列をScalaSparkの新しいデータフレームに変換する

  8. 8

    Rでデータフレームの複数の列を文字列から数値に変換します

  9. 9

    2列のデータフレームを対称バイナリ行列に変換します

  10. 10

    データフレームの各行を文字列に変換します

  11. 11

    文字列形式の科学的記数法をsparkデータフレームの数値に変換します

  12. 12

    Pythonはラベル付きの文字列のリストでデータフレームを変換します

  13. 13

    データフレーム文字列列をArray [Int]に変換します

  14. 14

    Pythonはリストをデータフレーム内の文字列に変換します

  15. 15

    複数の文字列のリストをPythonデータフレームに変換します

  16. 16

    データフレーム配列列を複数のバイナリ列に分割します[R]

  17. 17

    データフレーム配列列を複数のバイナリ列に分割します[R]

  18. 18

    文字列列を持つsparkデータフレームをStructType列に変換します

  19. 19

    pysparksqlデータフレームで文字列の列を辞書に変換します

  20. 20

    Sparkデータフレーム内のタイプMapTypeの列のデータを文字列に変換します

  21. 21

    文字列の配列をデータフレーム列の整数の配列に変換します

  22. 22

    データフレーム(Python)のエントリのバイトを文字列に変換する方法は?

  23. 23

    Pandasデータフレームで列タイプを文字列から日時形式に変換します

  24. 24

    Excelでバイナリデータを文字列データに変換する

  25. 25

    csvデータフレームをインポートし、Pythonで文字列に変換します

  26. 26

    値のデータフレームを、一意の各値が列であるバイナリデータフレームに変換します

  27. 27

    Pythonで1列のSparkデータフレームをピップライン文字で区切られた単一の文字列に変換する

  28. 28

    Pythonバイナリ文字列をバイナリintに変換します

  29. 29

    文字列のパンダデータフレームをintのnumpy配列に変換します

ホットタグ

アーカイブ