r에서 txt 파일을 가져올 때 두 줄이 아닌 모든 값이있는 한 줄만 있습니다. 문제는이 # @ # @ #이라고 생각합니다. 문제 해결을 도와 주시겠습니까?
파일의 예 :
A '~'40337463 '~' '~'1403289 '~'4620851 '~'21 '~' '~'STDLONG '~'A- '~'A- '~'2020-06-08 15:05:59 '~' '~' '~' '~' '~' '~' '~' '~' '~'EU '~' '~'New Rating '~' '~' '~'2023-06-28 00 : 00 : 00 '~' '~' '~'DE000A254Z26 # @ # @ # A '~'40337464 '~' '~'1403282 '~'4620842 '~'21 '~' '~'STDLONG '~' BBB + '~'BBB + '~'2020-06-08 15 : 11 : 49 '~' '~' '~' '~' '~' '~' '~' '~' '~'EE '~' ' ~ 'New Rating'~ ''~ ''~ '2030-12-31 00 : 00 : 00'~ ''~ ''~ 'US776743AJ55 # @ # @ #
dd <- data.table::fread("200610-204642spRatingDataNoCUSIP.txt", sep = "~", header = F)
산출:
한 가지 기본적인 접근 방식은 .txt
-file을 편집 #@#@#
하고 줄 바꿈으로 바꾸는 것 입니다.
readr
및 사용하는 또 다른 접근 방식 stringr
:
df <- read_lines("test.csv") %>%
str_split("#@#@#", simplify=TRUE) %>%
read_delim(delim="~", col_names=FALSE) %>%
mutate(across(everything(), str_remove_all, pattern="'"))
파일 이름을으로 지정하고 test.csv
그에 따라 변경합니다. 분명히 이것이 큰 파일에서 작동하는지 확실하지 않지만 시도해 볼 수 있습니다.
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다