データフレーム内のx文字ごとに文字列を分割

debugcn 投稿 Dev

CodeNoob

これとこれのnthように、文字列をすべての文字に分割することについていくつかの答えがあることを私は知っていますが、これらはかなり質問固有であり、ほとんどが単一の文字列に関連し、複数の文字列のデータフレームには関連していません。

データ例

df <- data.frame(id = 1:2, seq = c('ABCDEFGHI', 'ZABCDJHIA'))

このように見えます：

  id       seq
1  1 ABCDEFGHI
2  2 ZABCDJHIA

3文字ごとに分割

結果のデータフレームが次のようになるように、各行の文字列を3番目の文字ごとに分割します。

id  1   2   3
1   ABC DEF GHI
2   ZAB CDJ HIA

私が試したこと

splitstackshape以前を使用して、次のように1つの文字で文字列を分割df %>% cSplit('seq', sep = '', stripWhite = FALSE, type.convert = FALSE)しました。3つおきの文字で分割する同様の関数（またはcSplitで可能）が欲しいです。

akrun

オプションは separate

library(tidyverse)
df %>%
    separate(seq, into = paste0("x", 1:3), sep = c(3, 6))
# id  x1  x2  x3
#1  1 ABC DEF GHI
#2  2 ZAB CDJ HIA

より一般的なものを作成したい場合

n1 <- nchar(as.character(df$seq[1])) - 3
s1 <- seq(3, n1, by = 3)
nm1 <- paste0("x", seq_len(length(s1) +1))
df %>% 
    separate(seq, into = nm1, sep = s1)

またはbase R、を使用して、を使用strsplitして、正規表現ルックアラウンドをaに渡し、list次に要素に渡すことにより、3文字のインスタンスごとに「seq」列を分割rbindしlistます。

df[paste0("x", 1:3)] <- do.call(rbind, 
           strsplit(as.character(df$seq), "(?<=.{3})", perl = TRUE))

注：数字などの非標準のラベルで始まる列名は避けることをお勧めします。そのため、名前の先頭に「x」を追加しました

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-10

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

データフレーム内のx文字ごとに文字列を分割

データフレーム内のx文字ごとに文字列を分割

データフレーム内の要素列のレベルごとに文字列の要素数を数える

データフレーム内の2つの文字列列を行ごとに比較します

pandasデータフレーム内の類似の文字列値を1年ごとにカウントする

PySparkデータフレームに列（文字列の配列）があります。配列を分割して、配列内の文字列アイテムごとに個別の行を作成するにはどうすればよいですか？

パンダデータフレーム内の文字列の分割

パンダデータフレーム内の文字列の分割

データフレーム内の行内の列文字列要素を分割する

Python：データフレーム内の文字列列を分割する方法は？

文字列内のリストを含むデータフレーム列を2列に分割します

データフレーム文字列列を複数の列に分割します

データフレーム文字列列を複数の列に分割します

データフレーム文字列列を複数の列に分割します

Pythonデータフレーム-文字列列を2つの列に分割

Pandasデータフレーム：混合フロート文字列列を個別のフロート列と文字列列に分割します

データフレームの列ごとに最大文字列長を見つける方法

Rデータフレーム：列内、行間、グループごとの文字列の集約

文字列のリストを高速でデータフレームに分割する

Rデータフレームのdplyr行ごとに2つの文字列を減算します

R-データフレーム内のさまざまな文字列長の列を1文字の複数の列に分割する

文字列を繰り返すことによるデータフレームの分割

条件に基づいてパンダデータフレーム列の特殊文字の文字列を分割する

値と区切り文字に基づいてデータフレーム内のすべての列を分割する

pandasデータフレーム列内のタプルで文字列を分割する

文字の値に基づいてデータフレーム文字を列に分割します

R データ フレーム内の文字列を反転

データフレーム内の列の値を小文字にする方法は？

データフレーム文字列列をパターンなしで複数の列に分割する

Rのデータフレームのn列の文字列を分割します

Rを使用したデータフレームの列としての文字列内の文字の頻度

R データフレーム内の文字列を反転