我查看了library(nycflights13)
包裹中的“航班”表。我尝试从中创建一个表格,其中包含每个始发机场每个承运人的航班数量。我最初的想法是计算每个始发机场的每家航空公司的数量。
因此表可能如下所示:
number of flights / carrier / origin
200-AA-JFK
147-AA-ALM (because airlines could have flown off from different airports)
etc...
坦白说,我不知道如何在编码方面解决这个问题。我从这个简单的两层开始:
flights %>%
count(carrier)
它显示了每个航空公司的数量。是否可以通过某种方式添加另一个计数标准(例如起点),以便该功能可以为每个起点计数航空公司的数量?
一种选择是group_by
,然后乘坐sum
“航班”
library(nycflights13)
library(dplyr)
flights %>%
group_by(origin, carrier) %>%
summarise(nflights = sum(flight), count = n())
如果我们不需要sum
'flight',请count
与多列一起使用
flights %>%
count(origin, carrier)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句