を使用して列を効率的に選択する方法を理解しようとしていdplyr::select_if
ます。starwars
dplyr 0.70のデータセットは、これに使用するのに適したデータセットです。
> starwars
# A tibble: 87 x 13
name height mass hair_color skin_color eye_color birth_year gender homeworld species films vehicles starships
<chr> <int> <dbl> <chr> <chr> <chr> <dbl> <chr> <chr> <chr> <list> <list> <list>
1 Luke Skywalker 172 77 blond fair blue 19.0 male Tatooine Human <chr [5]> <chr [2]> <chr [2]>
2 C-3PO 167 75 <NA> gold yellow 112.0 <NA> Tatooine Droid <chr [6]> <chr [0]> <chr [0]>
3 R2-D2 96 32 <NA> white, blue red 33.0 <NA> Naboo Droid <chr [7]> <chr [0]> <chr [0]>
4 Darth Vader 202 136 none white yellow 41.9 male Tatooine Human <chr [4]> <chr [0]> <chr [1]>
5 Leia Organa 150 49 brown light brown 19.0 female Alderaan Human <chr [5]> <chr [1]> <chr [0]>
6 Owen Lars 178 120 brown, grey light blue 52.0 male Tatooine Human <chr [3]> <chr [0]> <chr [0]>
7 Beru Whitesun lars 165 75 brown light blue 47.0 female Tatooine Human <chr [3]> <chr [0]> <chr [0]>
8 R5-D4 97 32 <NA> white, red red NA <NA> Tatooine Droid <chr [1]> <chr [0]> <chr [0]>
9 Biggs Darklighter 183 84 black light brown 24.0 male Tatooine Human <chr [1]> <chr [0]> <chr [1]>
10 Obi-Wan Kenobi 182 77 auburn, white fair blue-gray 57.0 male Stewjon Human <chr [6]> <chr [1]> <chr [5]>
ここで、整数のみの列を選択したいとします。これはうまく機能します:
library(dplyr)
starwars %>%
select_if(is.numeric)
しかし、複数の基準に基づいて選択したい場合はどうすればよいですか。たとえば、数値列と文字列の両方が必要な場合があります。
starwars %>%
select_if(c(is.numeric, is.character))
または、すべての数値とname
列が必要な場合もあります。
starwars %>%
select_if(name, is.character)
上記の2つの例はどちらも機能しないため、ここで概説したことをどのように達成できるのでしょうか。
~
匿名関数を表すエレガントなtidyverse構文は、関数を使用select_if
するときに役立つ場合があります。
require(tidyverse)
# numeric and character columns
starwars %>% select_if(~ is.numeric(.) | is.character(.))
# all numeric AND the name column
starwars %>% select(name, where(is.numeric))
整然とした作成者によると、何らかの理由でis.numeric
内部などの述語関数をselect
ラップすることをお勧めしますwhere()
。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加