英国の各警察署をその地域に基づいてグループ化したいのですが、初心者なので、一度に複数の要素の名前を変更する方法がわかりません。
例:現在の様子
エイボンとサマセット、ドーセット、グロスター、ウィルトシャーの警察署は南西にあります。「南西」の上の警察署の名前を変更する機能が必要です。
英国の警察のウェブサイトからダウンロードした元のcsvデータセットで行いますが、分析の範囲は2019年1月から2020年11月で、各csvデータセットは月ごと、地域ごとにのみダウンロードできます(合計で約900 csvファイル)。
データフレーム内の単一のセルを選択する以下の機能を認識していますが、このデータセットは大きすぎて実行できません。
data[row number, col number] <- "South West"
任意の提案をいただければ幸いです。初心者を救出してくれてありがとう。
ps私は2019年と2020年のすべての警察署のすべてのcsvデータセットを使用してマージしました
crimedata19_20 <- list.files(path="C:/Users/X/Desktop/Crime data/2019-2020",
pattern="*.csv")
crimedata19_20 <- do.call("rbind",lapply(crimedata19_20,FUN=function(files){ read.csv(files)}))
gsub
パターンを置き換えるために使用できます。Rに付属するデータセットの使用例iris
:
iris[49:52, ]
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 49 5.3 3.7 1.5 0.2 setosa
# 50 5.0 3.3 1.4 0.2 setosa
# 51 7.0 3.2 4.7 1.4 versicolor
# 52 6.4 3.2 4.5 1.5 versicolor
列内のすべて"setosa"
を"South West"
に置き換え"Species"
ます。
res <- transform(iris,
Species=gsub(pattern="setosa", replacement="south West", Species))
res[49:52, ]
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 49 5.3 3.7 1.5 0.2 south West
# 50 5.0 3.3 1.4 0.2 south West
# 51 7.0 3.2 4.7 1.4 versicolor
# 52 6.4 3.2 4.5 1.5 versicolor
|
(または)で区切ることができる複数の置換。
res2 <- transform(iris,
Species=gsub(pattern="setosa|versicolor", replacement="south West", Species))
res2[49:52, ]
# Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 49 5.3 3.7 1.5 0.2 south West
# 50 5.0 3.3 1.4 0.2 south West
# 51 7.0 3.2 4.7 1.4 south West
# 52 6.4 3.2 4.5 1.5 south West
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加