複数の単語がある場合はコンマの後の文字列の最後の単語を抽出し、それ以外の場合は最初の単語を抽出します

debugcn 投稿 Dev

user3570187

次のような言葉のデータがあります

 location<- c("xyz, sss, New Zealand", "USA", "Pris,France")
 id<- c(1,2,3)
 df<-data.frame(location,id)

データから国名を抽出したいと思います。トリッキーな部分は、最後の単語だけを抽出すると、レコードが1つだけになることです（フランス）。

library(stringr)
df$country<- word(df$location,-1)

このデータから国のデータを抽出する方法について何かアイデアはありますか？

 id  location                      country
  1   xyz, sss, New Zealand        New Zealand
  2   USA                          USA
  3   Pris,France                  France

akrun

あなたが試すことができます sub

 df$country <- sub('.*,\\s*', '', df$location)
 df$country
 #[1] "New Zealand" "USA"         "France"

または

 library(stringr)
 str_extract(df$location, '\\b[^,]+$')
 #[1] "New Zealand" "USA"         "France"

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-05-28

コメントを追加

サインイン

Related 関連記事

記事

複数の単語がある場合はコンマの後の文字列の最後の単語を抽出し、それ以外の場合は最初の単語を抽出します

複数の単語がある場合はコンマの後の文字列の最後の単語を抽出し、それ以外の場合は最初の単語を抽出します

コメントを追加

関連記事

Related 関連記事

ホットタグ

アーカイブ