是否可以在Sparklyr中使用本机R代码或其他R包函数?

马特·波洛克

我已经到了可以跟随此处示例的地步(仅对config=list()输入参数进行了少许修改)。

sc <- spark_connect(master = "yarn-client", config=list())
library(dplyr)
flights_tbl <- copy_to(sc, nycflights13::flights, "flights")
flights_tbl %>% filter(dep_delay == 2)

Source:   query [?? x 16]
Database: spark connection master=yarn-client app=sparklyr local=FALSE

    year month   day dep_time dep_delay arr_time arr_delay carrier  tailnum     flight origin  dest air_time distance  hour minute
   <int> <int> <int>    <int>     <dbl>    <int>     <dbl>   <chr>    <chr>      <int>  <chr> <chr>    <dbl>    <dbl> <dbl>  <dbl>
1   2013     1     1      517         2      830        11    "UA" "N14228"       1545  "EWR" "IAH"      227     1400     5     17
2   2013     1     1      542         2      923        33    "AA" "N619AA"       1141  "JFK" "MIA"      160     1089     5     42
3   2013     1     1      702         2     1058        44    "B6" "N779JB"        671  "JFK" "LAX"      381     2475     7      2
4   2013     1     1      715         2      911        21    "UA" "N841UA"        544  "EWR" "ORD"      156      719     7     15
5   2013     1     1      752         2     1025        -4    "UA" "N511UA"        477  "LGA" "DEN"      249     1620     7     52
6   2013     1     1      917         2     1206        -5    "B6" "N568JB"         41  "JFK" "MCO"      145      944     9     17
7   2013     1     1      932         2     1219        -6    "VX" "N641VA"        251  "JFK" "LAS"      324     2248     9     32
8   2013     1     1     1028         2     1350        11    "UA" "N76508"       1004  "LGA" "IAH"      237     1416    10     28
9   2013     1     1     1042         2     1325        -1    "B6" "N529JB"         31  "JFK" "MCO"      142      944    10     42
10  2013     1     1     1231         2     1523        -6    "UA" "N402UA"        428  "EWR" "FLL"      156     1065    12     31
# ... with more rows

但是,当我尝试使用其他R函数时,可能dplyr会出现问题:

flights_tbl %>% filter(dep_delay == 2 & grepl("A$", tailnum)) 
Source:   query [?? x 16]
Database: spark connection master=yarn-client app=sparklyr local=FALSE

Error: org.apache.spark.sql.AnalysisException: undefined function GREPL; line 4 pos 41
at org.apache.spark.sql.hive.HiveFunctionRegistry$$anonfun$lookupFunction$2$$anonfun$1.apply(hiveUDFs.scala:69)
at org.apache.spark.sql.hive.HiveFunctionRegistry$$anonfun$lookupFunction$2$$anonfun$1.apply(hiveUDFs.scala:69)
at scala.Option.getOrElse(Option.scala:120)
at org.apache.spark.sql.hive.HiveFunctionRegistry$$anonfun$lookupFunction$2.apply(hiveUDFs.scala:68)
at org.apache.spark.sql.hive.HiveFunctionRegistry$$anonfun$lookupFunction$2.apply(hiveUDFs.scala:64)
at scala.util.Try.getOrElse(Try.scala:77)
at org.apache.spark.sql.hive.HiveFunctionRegistry.lookupFunction(hiveUDFs.scala:64)
at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveFunctions$$anonfun$apply$12$$anonfun$applyOrElse$5$$anonfun$applyOrElse$24.apply(Analyzer.scala:574)
at org.apache.spark.sql.catalyst.analysis.Analyzer$ResolveFunctions$$anonfun$apply$12$$anonfun$applyOrElse$5$$anonfun$applyOrElse$24.apply(Analyzer.

显然grepl不支持。我的问题是:有没有办法使用基本的R或R包函数?如果不是,它会来吗?v2dapplyv2中,似乎遵循这些原则的工作正在进行,但如果v2一起工作,那就太好了gapplySparkRsparklyr

马特·波洛克

刚刚看到这个问题的火花。简短的回答是“尚未”。期待添加此功能的将来版本。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

R:可以在mutate()(dplyr包)中使用exist()函数吗?

来自分类Dev

是否可以在ARC中使用本机C ++代码?

来自分类Dev

是否可以在ARC中使用本机C ++代码?

来自分类Dev

我可以在代码中使用其他内容代替“ this”吗?

来自分类Dev

可以在sparkR中使用R包吗?

来自分类Dev

是否可以在Conda环境中使用其他gcc版本?

来自分类Dev

是否可以在其他绑定中使用绑定?

来自分类Dev

我可以在其他函数中使用本地“ this”吗?

来自分类Dev

是否可以在闭包中使用外部定义的函数

来自分类Dev

R-之后如何在其他代码中使用readline()?

来自分类Dev

R-之后如何在其他代码中使用readline()?

来自分类Dev

根据是否在其他行中重复,在R中使用dplyr添加一列

来自分类Dev

如何在R中使用tidyr group_by函数添加其他列?

来自分类Dev

在R中使用apply(或其他迭代函数)创建向量矩阵

来自分类Dev

是否可以在Windows上使用R调查软件包的`svyby`函数multicore =参数?

来自分类Dev

是否可以从其他程序包访问在友好类中构建的公共构造函数?

来自分类Dev

是否可以在会话中使用变量以在其他页面中使用?

来自分类Dev

使用lapply或其他技术合并重复的r代码

来自分类Dev

可以在其他应用程序的Flex本机扩展中使用共享内部文件(例如,使用FileProvider)

来自分类Dev

在R中使用Apply和其他向量参数

来自分类Dev

在Azure函数代码中使用Python包

来自分类Dev

有什么办法可以执行求和而不是使用cut或使用R的任何其他函数进行计数

来自分类Dev

R:如何在包中使用get和set函数?

来自分类Dev

在R函数中使用“问题”包时出错

来自分类Dev

是否可以在许多其他应用程序使用的模块中使用深度链接?

来自分类Dev

在不使用循环的情况下汇总R中的数据时,是否可以从其他组访问数据?

来自分类Dev

是否可以使用其他树作为R中的子节点来构建data.tree?

来自分类Dev

使用'apply'函数在R中使用条件语句执行代码

来自分类Dev

如果在特定情况下未返回整数,是否可以在函数中使用return 1,return 2或任何其他整数而不是return 0?

Related 相关文章

  1. 1

    R:可以在mutate()(dplyr包)中使用exist()函数吗?

  2. 2

    是否可以在ARC中使用本机C ++代码?

  3. 3

    是否可以在ARC中使用本机C ++代码?

  4. 4

    我可以在代码中使用其他内容代替“ this”吗?

  5. 5

    可以在sparkR中使用R包吗?

  6. 6

    是否可以在Conda环境中使用其他gcc版本?

  7. 7

    是否可以在其他绑定中使用绑定?

  8. 8

    我可以在其他函数中使用本地“ this”吗?

  9. 9

    是否可以在闭包中使用外部定义的函数

  10. 10

    R-之后如何在其他代码中使用readline()?

  11. 11

    R-之后如何在其他代码中使用readline()?

  12. 12

    根据是否在其他行中重复,在R中使用dplyr添加一列

  13. 13

    如何在R中使用tidyr group_by函数添加其他列?

  14. 14

    在R中使用apply(或其他迭代函数)创建向量矩阵

  15. 15

    是否可以在Windows上使用R调查软件包的`svyby`函数multicore =参数?

  16. 16

    是否可以从其他程序包访问在友好类中构建的公共构造函数?

  17. 17

    是否可以在会话中使用变量以在其他页面中使用?

  18. 18

    使用lapply或其他技术合并重复的r代码

  19. 19

    可以在其他应用程序的Flex本机扩展中使用共享内部文件(例如,使用FileProvider)

  20. 20

    在R中使用Apply和其他向量参数

  21. 21

    在Azure函数代码中使用Python包

  22. 22

    有什么办法可以执行求和而不是使用cut或使用R的任何其他函数进行计数

  23. 23

    R:如何在包中使用get和set函数?

  24. 24

    在R函数中使用“问题”包时出错

  25. 25

    是否可以在许多其他应用程序使用的模块中使用深度链接?

  26. 26

    在不使用循环的情况下汇总R中的数据时,是否可以从其他组访问数据?

  27. 27

    是否可以使用其他树作为R中的子节点来构建data.tree?

  28. 28

    使用'apply'函数在R中使用条件语句执行代码

  29. 29

    如果在特定情况下未返回整数,是否可以在函数中使用return 1,return 2或任何其他整数而不是return 0?

热门标签

归档