私はRを初めて使用するので、データフレーム内のベクトルから単語とそれに続く引用符で囲まれた単語を削除する必要があります。
これが私が持っているもののビットです:
c("'character': 'Ted the Bellhop', 'credit_id': '52fe420dc3a36847f80001b7', 2",
"'character': 'Man', 'credit_id': '52fe420dc3a36847f800018b', 2",
"'character': 'Angela', 'credit_id': '52fe420dc3a36847f8000183', 1")
私は大きなデータセットを扱っているので、「文字」を削除できる方法を見つける必要があります:そしてその後に続くもの(「Tedthe Bellhop」、「Man」など)
fromJSONを使ってみましたが、うまくいかなかったので、手動で削除することにしました。以下を使用して、数字のみを含むフィールドを削除することができました。
x <- gsub("'cast_id': [[:digit:]]+,", "", x)
これはそれを行う必要があります:
x <- gsub("'character': '[^']*',", "", x)
これは、cast_id
フィールドに対して行ったのとほぼ同じですが'[^']*'
、数字ではなく正規表現に一致する値が削除される点が異なります。これを次のように読んでください:
[^']
:以外の文字 '
[^']*
:上記と同じ、0回以上繰り返す'[^']*'
:上記と同じ、一重引用符で囲みますこれが理にかなっていることを願っています。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加