複数の単語がある場合はコンマの後の文字列の最後の単語を抽出し、それ以外の場合は最初の単語を抽出します

user3570187

次のような言葉のデータがあります

 location<- c("xyz, sss, New Zealand", "USA", "Pris,France")
 id<- c(1,2,3)
 df<-data.frame(location,id)

データから国名を抽出したいと思います。トリッキーな部分は、最後の単語だけを抽出すると、レコードが1つだけになることです(フランス)。

library(stringr)
df$country<- word(df$location,-1)

このデータから国のデータを抽出する方法について何かアイデアはありますか?

 id  location                      country
  1   xyz, sss, New Zealand        New Zealand
  2   USA                          USA
  3   Pris,France                  France
akrun

あなたが試すことができます sub

 df$country <- sub('.*,\\s*', '', df$location)
 df$country
 #[1] "New Zealand" "USA"         "France"   

または

 library(stringr)
 str_extract(df$location, '\\b[^,]+$')
 #[1] "New Zealand" "USA"         "France"     

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

Related 関連記事

ホットタグ

アーカイブ