如何使用pyspark和regex在字符串的RDD中查找所有以my_str开头的单词？

Elm662 发表于 Dev

榆木662

我有一个字符串的RDD（全部为小写），并且我想使用正则表达式来匹配或查找所有以“ can”开头的单词。如何在Python中执行此操作？

例如，像这样的输入

rdd = sc.parallelize(['canada','canpar','beauty','can'])

我想要一个输出像

['canada','canpar','can']

这是一个RDD。

四月

使用字符串功能

filteredRDD = rdd.filter(lambda x: x.startswith('can'))

与使用re模块

import re
filteredRDD = rdd.filter(lambda x: re.compile('can').match(x))

您可以通过以下方式收集filteredRDD的内容来测试结果： filteredRDD.collect()

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-03-3

我来说两句

0条评论

登录后参与评论

下一篇：在NERDtree上导航时如何更改vim工作目录

来自分类Dev

使用Python中的regex查找字符串中以给定子字符串开头和结尾的所有字符串

来自分类Dev

C＃RegEx查找特定字符串或字符串中的所有单词

来自分类Dev

在长字符串中查找所有以@@开头并以@@结尾的单词

来自分类Dev

从字符串中删除所有以“ @”开头的单词

来自分类Dev

RegEx查找多个单词的所有出现和实例（如果它们存在于字符串中）

来自分类Dev

如何查找和移动与给定的文件开头（BOF）字符串匹配的所有文件？

来自分类Dev

如何使用python Regex查找给定字符串中的所有完全匹配项

来自分类Dev

在C ++ 11中，如何在以给定字符串开头的字符串向量中查找并返回所有项？

来自分类Dev

如何在BeautifulSoup中查找所有班级以字符串开头的div？

来自分类Dev

如何使用查找和替换用vscode中的kebab字符串替换所有驼峰式字符串

来自分类Dev

使用regexp_substr捕获两个单词（包括字符串的开头和结尾）之间的所有字符

来自分类Dev

php regex查找以＃开头的字符串中的单词，不再重复＃

来自分类Dev

查找字符串中单词的长度并查找具有该长度的单词。不使用导入和NLTK（Python）

来自分类Dev

JavaScript RegEx替换字符串中以＃开头的单词

来自分类Dev

使用python如何从目录和子文件中的所有文件中查找字符串

来自分类Dev

查找所有可能的子字符串，以捕获组中的字符开头

来自分类Dev

查找并删除所有以x开头的字符串的出现

来自分类Dev

PHP如何在字符串中查找所有以$或£符号开头的价格并将其替换为引导标签

来自分类Dev

使用 EPPLUS 查找和替换所有字符串

来自分类Dev

如何在没有引号的情况下多次使用的字符串中查找单词

来自分类Dev

PHP Regex查找字符串中所有大写的单词

来自分类Dev

PHP Regex查找字符串中所有大写的单词

来自分类Dev

如何从字符串的开头和结尾删除所有特殊字符，并且期望＃和，？

来自分类Dev

正则表达式-查找所有以$ _开头的单词，它们都落在模板字符串之间

来自分类Dev

使用RegEx从Python字符串的开头剥离所有非字母字符

来自分类Dev

使用RegEx从Python字符串的开头删除所有非字母字符

来自分类Dev

如何使用字符串中的匹配项获取所有单词

来自分类Dev

如何使用mysql php选择与字符串中某些单词匹配的所有记录

来自分类Dev

如何获得带有特殊单词开头和结尾的行字符串？

Related 相关文章

文章