在数据框中添加一个新列,其中包含基于列表或向量从另一个文本中提取的文本

加文

我有一个包含文本字符串列的R数据框。我想添加一个新列,其中一个单词与一个字符串匹配,然后将该字符串放入其中。我了解如何针对一个特定的文本目标执行此操作,如下面的可重现示例所示:

#make a data frame
library(tidyverse)
d=c("Buy apples here","Pears are cheap","Oranges for sale", "Potatoes are not fruit")
df<-as.data.frame(d)

#extract 'Orange' into a new column called 'fruit'
df<-df%>%mutate(fruit = str_extract(d, "Orange"))

但是,如何通过使用单词列表作为目标来对此向量化?

#target words
f=c("orange", "apple","pear")
dfa<-as.data.frame(f) 

以及如何忽略这种情况,以便得到结果集,因此“ apple”和“ Orange”都产生匹配项,并在新列中放置了正确的水果描述:

#desired output 
f1=c("apple","pear","orange","<NA>")
dfb<-as.data.frame(cbind(d,f1))
dfb

非常感谢。

艾伦·卡梅伦

您可以从要匹配的字符串向量中构建一个正则表达式,将它们粘贴在一起并由管道运算符将它们分开|您可以通过在匹配过程中将d都转换f为大写(或小写)来消除大小写问题

df %>% 
  mutate(fruit = str_extract(toupper(d), 
                             toupper(paste(unique(dfa$f), collapse = "|"))))
#>                        d  fruit
#> 1        Buy apples here  APPLE
#> 2        Pears are cheap   PEAR
#> 3       Oranges for sale ORANGE
#> 4 Potatoes are not fruit   <NA>

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

熊猫:根据另一个数据框中的值在数据框中添加新列

来自分类Dev

如何基于另一个数据框上的条件匹配在数据框中创建新列?

来自分类Dev

根据另一个数据框的行值在数据框中添加新列

来自分类Dev

使用另一个列表中的值在数据框中添加行

来自分类Dev

如何基于R中的另一个数据框将文本分配到列中

来自分类Dev

基于另一个数据框中的多个标识符从数据框中提取行

来自分类Dev

如何基于Pandas数据框中的另一个列值添加列?

来自分类Dev

比较两个数据框,然后根据另一个数据框向其中一个数据框添加新列

来自分类Dev

在另一个文本框中的选定文本之前添加文本

来自分类Dev

基于另一个下拉列表的动态文本框和下拉列表 -javascript

来自分类Dev

在数据框中创建一个新变量,条件是另一个数据框

来自分类Dev

创建一个新列表,其中包含另一个列表中某些单词的以下值

来自分类Dev

根据另一个数据框/列表在数据框中的列子集

来自分类Dev

在另一个文本框中输入数据时文本框完成

来自分类Dev

如何从一个文本文件中提取行,该文本文件包含另一个文件中的列表中的字符串?

来自分类Dev

R在数据框中找到小于另一个向量中的值的值

来自分类Dev

根据与另一个数据框的匹配在数据框中创建新列

来自分类Dev

基于将第二个向量与另一个对象中的行名匹配,在数据框中创建向量

来自分类Dev

使用熊猫基于另一个数据框向数据框添加列

来自分类Dev

从一个段落中提取文本,然后插入到另一个段落中

来自分类Dev

使用grep从文本文件中提取数据并将其保存在另一个目录中

来自分类Dev

如何将一个Access DataTable中的数据添加到同一数据库中的另一个Datatable中,其中插入的数据依赖于文本框控件?

来自分类Dev

如何在R bu中对数据框进行子集提取,以及如何基于类似的列将一个数据框的列添加到另一个数据框

来自分类Dev

在 R 中创建一个包含另一个数据框统计信息的新数据框

来自分类Dev

根据另一个文本文件中的两列从文件中提取行

来自分类Dev

如果另一个列或数组中存在文本值,则提取文本值

来自分类Dev

在数据框中添加新因子以替换另一个因子后,字母顺序无法正常工作

来自分类Dev

R中另一个df的列不同时在数据框中添加空列的功能

来自分类Dev

R中另一个df的列不同时在数据框中添加空列的功能

Related 相关文章

  1. 1

    熊猫:根据另一个数据框中的值在数据框中添加新列

  2. 2

    如何基于另一个数据框上的条件匹配在数据框中创建新列?

  3. 3

    根据另一个数据框的行值在数据框中添加新列

  4. 4

    使用另一个列表中的值在数据框中添加行

  5. 5

    如何基于R中的另一个数据框将文本分配到列中

  6. 6

    基于另一个数据框中的多个标识符从数据框中提取行

  7. 7

    如何基于Pandas数据框中的另一个列值添加列?

  8. 8

    比较两个数据框,然后根据另一个数据框向其中一个数据框添加新列

  9. 9

    在另一个文本框中的选定文本之前添加文本

  10. 10

    基于另一个下拉列表的动态文本框和下拉列表 -javascript

  11. 11

    在数据框中创建一个新变量,条件是另一个数据框

  12. 12

    创建一个新列表,其中包含另一个列表中某些单词的以下值

  13. 13

    根据另一个数据框/列表在数据框中的列子集

  14. 14

    在另一个文本框中输入数据时文本框完成

  15. 15

    如何从一个文本文件中提取行,该文本文件包含另一个文件中的列表中的字符串?

  16. 16

    R在数据框中找到小于另一个向量中的值的值

  17. 17

    根据与另一个数据框的匹配在数据框中创建新列

  18. 18

    基于将第二个向量与另一个对象中的行名匹配,在数据框中创建向量

  19. 19

    使用熊猫基于另一个数据框向数据框添加列

  20. 20

    从一个段落中提取文本,然后插入到另一个段落中

  21. 21

    使用grep从文本文件中提取数据并将其保存在另一个目录中

  22. 22

    如何将一个Access DataTable中的数据添加到同一数据库中的另一个Datatable中,其中插入的数据依赖于文本框控件?

  23. 23

    如何在R bu中对数据框进行子集提取,以及如何基于类似的列将一个数据框的列添加到另一个数据框

  24. 24

    在 R 中创建一个包含另一个数据框统计信息的新数据框

  25. 25

    根据另一个文本文件中的两列从文件中提取行

  26. 26

    如果另一个列或数组中存在文本值,则提取文本值

  27. 27

    在数据框中添加新因子以替换另一个因子后,字母顺序无法正常工作

  28. 28

    R中另一个df的列不同时在数据框中添加空列的功能

  29. 29

    R中另一个df的列不同时在数据框中添加空列的功能

热门标签

归档