如何在pyspark的RDD上访问元组中的单个元素？

Alibh 发表于 Dev

阿里布

可以说我有一个RDD

[(u'Some1', (u'ABC', 9989)), (u'Some2', (u'XYZ', 235)), (u'Some3', (u'BBB', 5379)), (u'Some4', (u'ABC', 5379))]

我map每次只能获取一个元组，但是如何访问元组的各个元素，例如查看元组是否包含某些字符。实际上，我想过滤掉那些包含某些字符的字符。这里包含的元组ABC

我试图做这样的事情，但没有帮助

def foo(line):
     if(line[1]=="ABC"):
          return (line)


new_data = data.map(foo)

我也是火花和Python的新手，请帮忙！！

大卫

RDD可以直接过滤。下面将为您提供在元组的第二个元素的第0个位置包含“ ABC”的所有记录。

new_data = data.filter(lambda x: x[1][0] == "ABC")

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-28

我来说两句

0条评论

登录后参与评论

上一篇：编译后Visual Studio冻结。当我尝试启动应用程序时，资源管理器也是如此

来自分类Dev

如何在WP 8.1 RT上访问MapItemsControl中的元素？

来自分类Dev

如何在继承元组的类中访问元组的元素

来自分类Dev

如何在python中访问名称元组中的元素？

来自分类Dev

如何访问元组中的元素？

来自分类Dev

如何访问元组列表中的元组元素

来自分类Dev

如何在 Pyspark 中 Srot rdd 内部列表元素？

来自分类Dev

如何在SCALA中访问RDD行中的元素

来自分类Dev

如何在Haskell元组中访问第n个元素

来自分类Dev

如何在Haskell元组中访问第n个元素

来自分类Dev

从元组列表访问单个元组的元素

来自分类Dev

从元组列表访问单个元组的元素

来自分类Dev

如何在Pdftron中的画布上访问文本层

来自分类Dev

Python：如何在打印功能中打印元组的单个元素

来自分类Dev

如何将元组中的每个元素除以单个整数？

来自分类Dev

如何在实例上访问静态成员？

来自分类Dev

如何在Windows上访问传真？

来自分类Dev

如何在Heroku上访问Parse Dashboard

来自分类Dev

如何在逻辑层上访问ClaimsIdentity

来自分类Dev

如何在Windows 7上访问SmartCtl？

来自分类Dev

如何在Ubuntu上访问SFTP

来自分类Dev

如何在 GKE 上访问 kubelet

来自分类Dev

如何在python中的单个元组中添加值

来自分类Dev

斯卡拉如何访问列表中元组中的元素

来自分类Dev

在Python中如何使用reduce（）访问元组的元素？

来自分类Dev

如何在Puppeteer中获取单个元素

来自分类Dev

如何在pyspark中查看RDD中每个分区的内容？

来自分类Dev

如何在pyspark中查看RDD中每个分区的内容？

来自分类Dev

如何访问串联存储的单个元组值？

来自分类Dev

如何在PySpark的UDF中返回“元组类型”？

Related 相关文章

文章