通过精确的单词匹配过滤熊猫数据框

尼尔

我在熊猫中有以下数据框

          Date                             Title
58      March 2015        Data Visualization with JavaScript
63   December 2014          Eloquent JavaScript, 2nd Edition
90    October 2014             If Hemingway Wrote JavaScript
96   December 2014                       JavaScript for Kids
158  February 2014  Principles of Object-Oriented JavaScript
209  November 2005                          Wicked Cool Java

我必须过滤其中包含单词JavaScript的行。我正在关注。

category_javascript = np.where(Publisher['Title'].str.contains(r'(?:\s|^)JavaScript(?:\s|$)'))

它给了我以下的outupt

category_javascript
Out[106]: (array([ 58,  90,  96, 158], dtype=int64),)

63 December 2014 Eloquent JavaScript, 2nd Edition我认为它不会过滤,因为JavaScript单词后面是逗号。我想找到准确的单词,而不考虑标点符号或组合形式。例如JavaScript-Book也可以。

请帮忙

耶斯列尔

IIUC,您不需要正则表达式,只需字符串JavaScript

category_javascript = np.where(Publisher['Title'].str.contains('JavaScript'))

print (Publisher['Title'].str.contains('JavaScript'))
58      True
63      True
90      True
96      True
158     True
209    False
Name: Title, dtype: bool

print (Publisher[Publisher['Title'].str.contains('JavaScript')])
              Date                                     Title
58      March 2015        Data Visualization with JavaScript
63   December 2014          Eloquent JavaScript, 2nd Edition
90    October 2014             If Hemingway Wrote JavaScript
96   December 2014                       JavaScript for Kids
158  February 2014  Principles of Object-Oriented JavaScript

您可以将变音符号添加到正则表达式中,例如[,;]

print (Publisher['Title'].str.contains('(?:\s|^|[,;])JavaScript(?:\s|$|[,;])'))
58      True
63      True
90      True
96      True
158     True
209    False
Name: Title, dtype: bool

print (Publisher['Title'].str.contains('(?:\s|^|[,;])Java(?:\s|$|[,;])'))
58     False
63     False
90     False
96     False
158    False
209     True
Name: Title, dtype: bool

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python:使用列表和数据框进行精确的单词匹配

来自分类Dev

通过ID列表过滤熊猫数据框

来自分类Dev

通过匹配多行对熊猫数据框排序

来自分类Dev

熊猫从数据框中找到与列表匹配的所有单词

来自分类Dev

熊猫数据框过滤

来自分类Dev

如何通过部分标签过滤熊猫数据框列

来自分类Dev

通过汇总两列来过滤熊猫数据框

来自分类Dev

熊猫通过字典列表中的值过滤数据框

来自分类Dev

通过字符串末尾过滤熊猫数据框

来自分类Dev

通过对熊猫的不同列应用条件来过滤数据框

来自分类Dev

熊猫数据框枚举通过过滤器的行

来自分类Dev

熊猫数据框的Fishers精确检验

来自分类Dev

用数据框中的单词替换精确的字符串,并仅包含特定单词的匹配字符串

来自分类Dev

如何删除熊猫数据框列中与另一列中的单词匹配的单词

来自分类Dev

过滤数据框的熊猫直方图

来自分类Dev

过滤熊猫中的数据框

来自分类Dev

过滤熊猫数据框聚合

来自分类Dev

过滤熊猫中的数据框

来自分类Dev

熊猫中的数据框过滤

来自分类Dev

SQL 匹配精确单词

来自分类Dev

熊猫数据框-通过另一个数据框的值过滤行

来自分类Dev

熊猫:计算单词的出现次数(来自另一个数据框),并输出计数和匹配的单词

来自分类Dev

根据两列之间的匹配值(精确)过滤数据帧

来自分类Dev

熊猫通过数据框搜索缺少变音符号的单词

来自分类Dev

使用基于部分字符串匹配的熊猫在python中过滤数据框

来自分类Dev

计算熊猫数据框中的不同单词

来自分类Dev

计算熊猫数据框中的单个单词

来自分类Dev

熊猫在数据框中的单词掉落

来自分类Dev

通过匹配另一个数据框来替换单词

Related 相关文章

热门标签

归档