搜索

搜索

在数据框中添加一个新列，其中包含基于列表或向量从另一个文本中提取的文本

debugcn 发表于 Dev

19

加文

我有一个包含文本字符串列的R数据框。我想添加一个新列，其中一个单词与一个字符串匹配，然后将该字符串放入其中。我了解如何针对一个特定的文本目标执行此操作，如下面的可重现示例所示：

#make a data frame
library(tidyverse)
d=c("Buy apples here","Pears are cheap","Oranges for sale", "Potatoes are not fruit")
df<-as.data.frame(d)

#extract 'Orange' into a new column called 'fruit'
df<-df%>%mutate(fruit = str_extract(d, "Orange"))

但是，如何通过使用单词列表作为目标来对此向量化？

#target words
f=c("orange", "apple","pear")
dfa<-as.data.frame(f)

以及如何忽略这种情况，以便得到结果集，因此“ apple”和“ Orange”都产生匹配项，并在新列中放置了正确的水果描述：

#desired output 
f1=c("apple","pear","orange","<NA>")
dfb<-as.data.frame(cbind(d,f1))
dfb

非常感谢。

艾伦·卡梅伦

您可以从要匹配的字符串向量中构建一个正则表达式，将它们粘贴在一起并由管道运算符将它们分开|。您可以通过在匹配过程中将d和都转换f为大写（或小写）来消除大小写问题：

df %>% 
  mutate(fruit = str_extract(toupper(d), 
                             toupper(paste(unique(dfa$f), collapse = "|"))))
#>                        d  fruit
#> 1        Buy apples here  APPLE
#> 2        Pears are cheap   PEAR
#> 3       Oranges for sale ORANGE
#> 4 Potatoes are not fruit   <NA>

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-5

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

熊猫：根据另一个数据框中的值在数据框中添加新列

来自分类Dev

如何基于另一个数据框上的条件匹配在数据框中创建新列？

来自分类Dev

根据另一个数据框的行值在数据框中添加新列

来自分类Dev

使用另一个列表中的值在数据框中添加行

来自分类Dev

如何基于R中的另一个数据框将文本分配到列中

来自分类Dev

基于另一个数据框中的多个标识符从数据框中提取行

来自分类Dev

如何基于Pandas数据框中的另一个列值添加列？

来自分类Dev

比较两个数据框，然后根据另一个数据框向其中一个数据框添加新列

来自分类Dev

在另一个文本框中的选定文本之前添加文本

来自分类Dev

基于另一个下拉列表的动态文本框和下拉列表 -javascript

来自分类Dev

在数据框中创建一个新变量，条件是另一个数据框

来自分类Dev

创建一个新列表，其中包含另一个列表中某些单词的以下值

来自分类Dev

根据另一个数据框/列表在数据框中的列子集

来自分类Dev

在另一个文本框中输入数据时文本框完成

来自分类Dev

如何从一个文本文件中提取行，该文本文件包含另一个文件中的列表中的字符串？

来自分类Dev

R在数据框中找到小于另一个向量中的值的值

来自分类Dev

根据与另一个数据框的匹配在数据框中创建新列

来自分类Dev

基于将第二个向量与另一个对象中的行名匹配，在数据框中创建向量

来自分类Dev

使用熊猫基于另一个数据框向数据框添加列

来自分类Dev

从一个段落中提取文本，然后插入到另一个段落中

来自分类Dev

使用grep从文本文件中提取数据并将其保存在另一个目录中

来自分类Dev

如何将一个Access DataTable中的数据添加到同一数据库中的另一个Datatable中，其中插入的数据依赖于文本框控件？

来自分类Dev

如何在R bu中对数据框进行子集提取，以及如何基于类似的列将一个数据框的列添加到另一个数据框

来自分类Dev

在 R 中创建一个包含另一个数据框统计信息的新数据框

来自分类Dev

根据另一个文本文件中的两列从文件中提取行

来自分类Dev

如果另一个列或数组中存在文本值，则提取文本值

来自分类Dev

在数据框中添加新因子以替换另一个因子后，字母顺序无法正常工作

来自分类Dev

R中另一个df的列不同时在数据框中添加空列的功能

来自分类Dev

R中另一个df的列不同时在数据框中添加空列的功能

Related 相关文章

文章

热门标签

归档