为什么ddply在此数据帧上不起作用？

user2395969 发表于 Dev

用户名

我有一个数据框，如下所示：

plan     address                                                                 preferred
S3440    5301 E Huron River Dr Rm 1538 Ann Arbor, MI 48106 1-734-712-2492, xxx   Not applicable
S3440    2140 E Ellsworth Rd Ann Arbor, MI 48108 1-734-477-9006, xxx             Not applicable
S3440    2215 Fuller Road Ann Arbor, MI 48105 1-734-761-7933, xxx                Not applicable

等等。价值约27000s行。地址标签后的电话号码后面还有更多内容，为简便起见，我省略了它。

我想拆分地址，基本上删除电话号码及其后的所有内容。我已经能够通过正则表达式做到这一点：

 str_split(x,'( [0-9]-[0-9]{3}-[0-9]{3}-[0-9]{4})')

我想将此功能应用于每一行，因此我编写了一个ddply“ function”：

ddply(final_data2, .(address), function(x){str_split(x,'( [0-9]-[0-9]{3}-[0-9]{3}-[0-9]{4})')})

但是，这会吐出错误：

Error: String must be an atomic vector

我也不知道为什么有人可以帮我解决这个问题吗？

谢谢

阿克伦

根据显示的模式，您可以尝试：（不使用ddply）

 library(stringr)
 str_extract(final_data2$address, perl('.*(?= .-.*)'))
 #[1] "5301 E Huron River Dr Rm 1538 Ann Arbor, MI 48106"
 #[2] "2140 E Ellsworth Rd Ann Arbor, MI 48108"          
 #[3] "2215 Fuller Road Ann Arbor, MI 48105"

说明

 ('.*(?= .-.*) # extract everything before a `space`, followed by one character, followed by `-`.

使用您的代码：

 simplify2array(str_split(final_data2$address, '( [0-9]-[0-9]{3}-[0-9]{3}-[0-9]{4})'))[c(T,F)]

#[1] "5301 E Huron River Dr Rm 1538 Ann Arbor, MI 48106"
#[2] "2140 E Ellsworth Rd Ann Arbor, MI 48108"          
#[3] "2215 Fuller Road Ann Arbor, MI 48105"

我不明白您为什么要使用ddply和address用作分组变量。这似乎可行，但不是必需的。

unlist(daply(final_data2, .(address), function(x){str_split(x$address,'( [0-9]-[0-9]{3}-[0-9]{3}-[0-9]{4})')}),use.names=F)[c(T,F)]

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-11

我来说两句

0条评论

登录后参与评论

上一篇：Javascript：使用两个参数进行布尔比较的while循环

来自分类Dev

为什么ngRepeat在此json对象上不起作用

来自分类Dev

为什么分配在此DataFrame上不起作用

来自分类Dev

为什么push在此cookie数组上不起作用？

来自分类Dev

为什么addEventListener在数据列表上不起作用？

来自分类Dev

为什么数据绑定在 UserControl 上不起作用？

来自分类Dev

为什么<script>标记在此PHP页面上不起作用？

来自分类Dev

为什么Count函数在此子查询上不起作用？

来自分类Dev

为什么动画帧不起作用？

来自分类Dev

为什么此SQL查询在Northwind数据库上不起作用？

来自分类Dev

为什么apply（）在R中的数据框上不起作用？

来自分类Dev

为什么数据断点在未对齐的地址上不起作用

来自分类Dev

为什么rownames（）在R中的数据框上不起作用？

来自分类Dev

为什么apply（）在R中的数据框上不起作用？

来自分类Dev

为什么在此示例中剩余的余量不起作用？

来自分类Dev

为什么selectionIndex在此代码中不起作用？

来自分类Dev

为什么接头在此for循环中不起作用？

来自分类Dev

为什么标头在此代码中不起作用？

来自分类Dev

为什么useRef在此示例中不起作用？

来自分类Dev

为什么jQuery在此wordpress插件中不起作用？

来自分类Dev

为什么在此示例中getElementsByTagName不起作用

来自分类Dev

为什么该路由在此代码中不起作用？

来自分类Dev

为什么grep在此命令中不起作用？

来自分类Dev

为什么在此示例中命令注入不起作用？

来自分类Dev

为什么“ 2>＆1”在此管道中不起作用？

来自分类Dev

为什么问号在此问题中不起作用？

来自分类Dev

为什么break（）在此循环中不起作用？（但停止是）

来自分类Dev

为什么 '=' 在此 SQL 查询中不起作用？

来自分类Dev

为什么CGContextSetRGBStrokeColor在ios7上不起作用？

来自分类Dev

为什么Fade过渡在共享元素上不起作用

Related 相关文章

文章