在自定义函数中包含额外的（省略号/点点）参数

debugcn 发表于 Dev

whack_overflow

我正在做一个有关文本挖掘的项目，因此我想编写一个小函数来计算文本中不同标记的数量。标记化是通过功能完成的，该功能tidytext::unnest_token基本上是tokenizers::tokenize_ngrams与管道一起使用的包装器。我当前的方法如下：

count_tokens <- function(data,output,token="words", ...){
  data %>% 
    select(textcolumn) %>% 
    tidytext::unnest_tokens(tbl=output, input=textcolumn, ...) %>% 
    n_distinct()
}

...只要我使用from的参数tidytext::unnest_token（例如to_lower或），此方法就可以正常工作（即使使用）drop。count_tokens(data, word, to_lower = FALSE)工作正常！

现在，tidytext::unnest_token状态文档...也可以用作传递给令牌生成器的其他参数，例如strip_punct用于“单词”和“ tweets”n以及k用于“ ngrams”和“ skip_ngrams”（...）。但是，如果我n在函数中包含省略号参数的参数，则会崩溃。

count_tokens(data, ngram, token = "ngrams", to_lower = FALSE, n = 10) 出现以下错误信息：

Error in tf(col, lowercase = to_lower, ...) : unused argument (n = 10)

有人可以指出正确的方向，甚至告诉我如何修改我的代码吗？

波尔卡斯

首先，您的示例似乎无效。对我来说，更新的功能正常工作。

library(dplyr)
library(tidytext)
library(janeaustenr)

count_tokens <- function(data,output,token="words", ...){
  d %>% 
    select(txt) %>% 
    tidytext::unnest_tokens(output, input="txt", token = token, ...) %>% 
    n_distinct()
}

d <- tibble(txt = prideprejudice)

count_tokens(d, "word", to_lower = FALSE)
#> [1] 6915

count_tokens(d, "ngram", token = "ngrams", to_lower = FALSE, n = 8)
#> [1] 122189

count_tokens(d, "ngram", token = "ngrams", to_lower = FALSE, n = 5)
#> [1] 121599

count_tokens(d, "ngram", token = "ngrams", to_lower = FALSE, n = 3)
#> [1] 104664

^{由reprex软件包（v0.3.0）创建于2021-02-03}

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-7

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

在自定义函数中包含额外的（省略号/点点）参数

在自定义函数中包含额外的（省略号/点点）参数

R：函数如何使用省略号（...）接受变量参数而不将其复制到内存中？

如何在Android TextView中使用自定义省略号

文本溢出省略号未以某些自定义字体显示

如何将省略号运算符得到的参数传递给其他函数？

使用额外的参数自定义“ at”以关闭？

如何使用自己的自定义函数（而不是vprintf等）处理可变参数（通过省略号）？

以参照透明的方式从函数的省略号参数中提取符号

在定义中使用省略号时，如何在R函数调用中捕获错误或未定义的参数

省略号作为可变参数模板之外的构造函数参数

省略项中的省略号省略

使函数对help（）函数中的参数使用省略号

在C中用省略号传递参数

如何让R识别省略号中的参数向量？

ocaml类型定义包含省略号

...（省略号）作为函数原型中的一个且唯一的函数参数在C ++中意味着什么？

Lisp / Scheme / Racket：如何用省略号定义函数

如何理解“包含省略号的抽象声明符只能在参数声明中使用”

在消息中包含用于自定义验证规则的参数

我们可以在自定义函数中包含条件作为参数吗？

R自定义函数-在标题中包含参数值

如何使用自己的自定义函数（而不是vprintf等）处理可变参数（通过省略号）？

嵌套函数调用和省略号的名称相同的参数

是否应该在可变参数函数中的省略号（...）之前直接声明count参数？

PyQt / Qt，带有自定义委托的tableview，用于使用省略号来显示文本溢出单元格

函数参数中的省略号是否使用与普通参数相同的调用布局

如何让R识别省略号中的参数向量？

省略号出现在模板函数的参数声明中

在我的自定义无索引函数（Wordpress）中包含额外的 url

为什么我要把省略号放在函数的参数中？