如何在RDD中将字符串元素转换为数字一

debugcn 发表于 Dev

参孙

我想在以下RDD中转换字符串元素

    data0 = sc.parallelize( [('0', '2.023'), ('0.2', '4.235'), ('1.23', '0.45'), ('1.23', '10.2'), ('1.0', '20.0')] )

为数值。所以预期的输出是

[(0, 2.023), (0.2, 4.235), (1.23, 0.45), (1.23, 10.2), (1.0, 20.0)]

我试过了

data0.map(lambda x: x.split(',')).map(lambda x: (float(x[0]),float(x[1])))

和

data0.map(lambda line: line.split(",")).map(lambda numbers: Vectors.dense(numbers.map(_.toInt)))

在将字符串RDD转换为Int RDD中。但是，他们都不起作用。

我知道也许有一些方法可以先将RDD转换为数据帧，然后再进行。如果我想在RDD中完成任务而不将其更改为数据帧（因为可能非常耗时）怎么办，该怎么办？这只是一个例子。在更一般的情况下，假设一行中有很多元素，这使您无法一一列出。那我们该怎么办呢？

谢谢。

皮索尔

您正在尝试用逗号分割元组。字符串可以用逗号分隔。"0.01, 0.02".split(",")会回来的["0.01", "0.02"]。但是您已经有了一个tuple ("0.01", "0.02")，只需要将两个元素都转换为float即可。您正在编写正确的代码，只是由于代码失败而采取了多余的第一步。

为我工作：

data0 = sc.parallelize([('0', '2.023'), ('0.2', '4.235'), ('1.23', '0.45'), ('1.23', '10.2'), ('1.0', '20.0')])
data0.take(5)
# [('0', '2.023'), ('0.2', '4.235'), ('1.23', '0.45'), ('1.23', '10.2'), ('1.0', '20.0')]
# Convert to float
data0.map(lambda x: (float(x[0]), float(x[1]))).take(5)
# [(0.0, 2.023), (0.2, 4.235), (1.23, 0.45), (1.23, 10.2), (1.0, 20.0)]

编辑：

如果要归纳到元素的所有元素tuple：

data0.map(lambda x: tuple([float(i) for i in x]))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-1

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何在RDD中将字符串元素转换为数字一

如何在RDD中将字符串元素转换为数字一

编辑：

如何在字符串和数字的RDD中将数字字符串转换为int？

如何在coffeescript中将数字转换为字符串？

如何在MySQL中将字符串转换为数字？

如何在netezza中将字符串转换为数字

如何在python中将数字转换为字符串？1->“一个”

如何在Swift中将多字符数字格式转换为可读的字符串？

如何在Javascript中将混合的HTML字符串/ DOM元素转换为DOM元素？

如何在Swift中将50位数字的字符串转换为适当的整数类型？

如何在Smalltalk中将数字转换为字符串（可视作品）

如何在Rust中将数字字符串转换为整数数组或整数向量？

如何在包含GROUP BY的SQL查询中将月份从数字转换为字符串形式？

如何在angularjs表达式中将字符串转换为数字或日期

如何在jQuery中将价格格式字符串转换为数字

如何在d3js中将字符串转换为数字

如何在Terraform模板文件中将字符串转换为数字

如何在JavaScript中将具有零的字符串转换为数字？

如何在R中将字符串double转换为数字double？

如何在php中将数字转换为字符串（字母）？

如何在存储过程中将数字转换为字符串

如何在Python中将具有数字范围的字符串转换为列表

如何在 Arduino 中将字符串转换为字符 *？

如何在Python中将元素（字符串）转换为元组中的整数

如何在Python列表中将带单引号的字符串元素转换为双引号

如何在元素内具有索引的javascript中将数组转换为json字符串

如何在C ++中将字符串数组转换为字符串类型，如将每个元素连接成一个字符串，并在字符串上使用子字符串？

如何在MySQL中将位转换为字符串？

如何在Lua中将字符串转换为表

如何在bash中将列表转换为字符串？

如何在SSIS中将字符串转换为BlobColumn