이 구조화되지 않은 데이터를 구조화로 변환하는 방법은 무엇입니까?

debugcn 에 게시 Dev

궁금한

내가 가진 데이터는 다음과 같습니다.

data <- c("24-March-2017       text1                         874874455221112                Text text text10",
  "25-March-2017       text2                          54654656TEXT                  Text text 11",
  "24-March-2017       text3                          874874455221112               Text text text 12",
  "25-March-2017                  text4                         54654656TEXT                    Text text  13",
  "26-March-2017     text3              54654TEXT   Text text text  14",
  "27-March-2017                text5                       6546TEXT    Text text text 15",
  "28-March-2017      text6                          546476876586TExt   Text text text 16",
  "29-March-2017                  text7      23453453TEXT     Text text  17")

이 데이터를 각 열 사이의 공백을 기반으로 구조화 된 형식으로 변환하고 싶습니다. 처음 세 행은 내가 원하는 데이터 모양과 똑같습니다. 최종 결과는 다음과 같아야합니다.

원래:

첫 번째 열 (날짜)이 0에서 시작 (변경할 필요 없음)
두 번째 열은 위치 20에서 시작해야합니다.
세 번째 열은 위치 50에서 시작합니다.
마지막 열은 80에서 시작합니다.

닉 케네디

이것은 주어진 데이터를 기반으로하며 다음을 가정합니다.

4 개의 열이 있습니다
처음 세 개는 그 안에 공백이 없으며 공백으로 구분됩니다.
마지막 열에는 공백이 포함될 수 있습니다.

일치하는 부분 문자열을 꺼내서 rbind행렬로 만들고 전역 일치 항목을 제거하고 a로 변환 data.frame한 다음 통과 sprintf하여 고정 너비 출력을 얻습니다.

data %>%
  regmatches(regexec("^(\\S+)\\s+(\\S+)\\s+(\\S+)\\s+(.*?)$", .)) %>%
  do.call("rbind", .) %>%
  .[, -1] %>%
  as.data.frame(stringsAsFactors = FALSE) %>%
  c(list("%-20s%-30s%-30s%s"), .) %>%
  do.call("sprintf", .)

# [1] "24-March-2017       text1                         874874455221112               Text text text10"  
# [2] "25-March-2017       text2                         54654656TEXT                  Text text 11"      
# [3] "24-March-2017       text3                         874874455221112               Text text text 12" 
# [4] "25-March-2017       text4                         54654656TEXT                  Text text  13"     
# [5] "26-March-2017       text3                         54654TEXT                     Text text text  14"
# [6] "27-March-2017       text5                         6546TEXT                      Text text text 15" 
# [7] "28-March-2017       text6                         546476876586TExt              Text text text 16" 
# [8] "29-March-2017       text7                         23453453TEXT                  Text text  17"

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-17

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

이 구조화되지 않은 데이터를 구조화로 변환하는 방법은 무엇입니까?

이 구조화되지 않은 데이터를 구조화로 변환하는 방법은 무엇입니까?

평면화 된 데이터를 구조화 된 JSON으로 변환하는 방법은 무엇입니까?

데이터베이스에서 구조화되지 않은 데이터를 수집하는 방법은 무엇입니까?

구조화되지 않은 데이터에서 특정 문자열 바로 앞의 날짜를 추출하는 방법은 무엇입니까?

Firebase에서 데이터를 구조화하는 방법은 무엇입니까?

Firebase에서 데이터를 구조화하는 방법은 무엇입니까?

C ++로 구조화하기 위해 데이터베이스를로드하는 방법은 무엇입니까?

조명기에서 구조화 된 데이터를 반환하는 올바른 방법은 무엇입니까?

Apache Pig를 사용하여 구조화되지 않은 데이터를 구조화하는 방법

복잡한 데이터 프레임 구조를 비정규 화하는 방법은 무엇입니까?

Pandas, 복잡한 데이터 프레임 구조를 비정규 화하는 방법은 무엇입니까?

Elixir : 구조화 된 데이터 요소를 표시하는 방법은 무엇입니까?

양식에서 제출 한 데이터를 구조화 / 제어하는 방법은 무엇입니까?

Spark에서 구조화 된 데이터를 schemaRDD에 매핑하는 방법은 무엇입니까?

mongoDB에서 JSON 데이터를 구조화하는 방법은 무엇입니까?

URL 배열을 트리 / 폴더 구조 데이터로 변환하는 방법은 무엇입니까?

표로 작성된 데이터 구조를 감지하는 가장 좋은 방법은 무엇입니까?

무작위 화없이 구조체를 기본적으로 해시하는 방법은 무엇입니까?

Firestore 데이터 암호화를 구현하는 방법은 무엇입니까?

레이블이없는 데이터와 구조화되지 않은 데이터

표시되지 않는 데이터를 버퍼로 읽도록 구성하는 방법은 무엇입니까?

데이터를 피벗하기 위해 구조화되지 않은 텍스트 열로 그룹화

많은 데이터 조작 / 정리를 수행 할 때 R에서 코드를 구조화하는 가장 좋은 방법은 무엇입니까?

평면화 된 json 데이터를 분류 문자열로 변환하는 방법은 무엇입니까?

JavaScript에서 데이터 구조를 만드는 방법은 무엇입니까?

두 가지 조건에서 데이터를 변환하는 방법은 무엇입니까?

OR 및 AND 조건이 예상대로 반환되지 않음-이를 구현하는 가장 좋은 방법은 무엇입니까?

정렬되지 않은 데이터 세트를 재구성하고 numpy로 남은 데이터를 버리는 방법은 무엇입니까?

reactjs에서 데이터 바이너리를 이미지로 변환하는 방법은 무엇입니까?

지속적 데이터 구조로 정렬 된 맵을 구성하는 방법은 무엇입니까?