在Apache Spark中使用Python在第n个位置获取字符串

ish
lines = sc.textFile(fileName)  

我正在尝试从每一行的位置10:20获取字符串,以进行一些处理。由于行是RDD,因此出现语法错误,表明没有__getitem__

李敏仪

请记住,lines是的的RDD(集合),String因此您需要substring在每个元素上调用某些符号()。要在RDD的每个成员上获得函数调用的结果,map是您的朋友。

Python(由@ zero323提供):

lines.map(lambda line: line[10:21])

Scala:

lines.map ( line => line.substring(10,20) )

这将返回另一个RDD,因此您需要在执行操作(即返回结果或写入文件)之前编写更多的转换,这将触发它运行。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用Apache BeanUtils将字符串转换为Enum

来自分类Dev

当我从Excel读取日期类型(Apache POI)时,获取字符串值

来自分类Dev

在Apache Spark(Scala)中使用reduceByKey

来自分类Dev

使用Apache Oozie编排Apache Spark

来自分类Dev

如何在字符串的第n个位置找到字符

来自分类Dev

apache SetEnvIf访问查询字符串

来自分类Dev

使用Scala在Apache Spark中拆分字符串

来自分类Dev

使用Apache Spark遍历字符串

来自分类Dev

在Apache Spark中使用R

来自分类Dev

Apache Spark与Apache Ignite

来自分类Dev

在Apache中使用ErrorDocument转发查询字符串

来自分类Dev

我可以使用spark-csv在Apache Spark中读取以字符串形式表示的CSV吗

来自分类Dev

使用Apache Beam将重复的字符串写入BigQuery

来自分类Dev

使用Apache-NiFi验证字符串长度

来自分类Dev

获取字符串中字母的第n次出现(python)

来自分类Dev

在Postgres中的字符串中查找特定字符的第n个位置

来自分类Dev

使用字符串作为Apache Camel端点吗?

来自分类Dev

apache重定向与查询字符串

来自分类Dev

Apache Poi公式字符串

来自分类Dev

重写查询字符串apache

来自分类Dev

使用apache重写规则发送查询字符串数据

来自分类Dev

Apache删除特定的查询字符串

来自分类Dev

多维列表获取字符串Python的位置

来自分类Dev

Apache Spark与Python

来自分类Dev

在数据集Apache Spark中拆分字符串

来自分类Dev

PHP在字符串的第n个位置替换2个字符

来自分类Dev

获取 apache.commons.cli.CommandLine 作为字符串

来自分类Dev

如何使用scala在Apache spark中用空字符串(“”)替换空值

来自分类Dev

使用 Apache mod rewrite 修改查询字符串

Related 相关文章

热门标签

归档