R을 사용하여 매우 더러운 주소를 정리하고 있습니다. gsub를 사용하여 문자열에서 FIRST 번호 앞의 모든 문자를 제거하고 싶지만 작동하는 정규식을 알아낼 수있는 것 같습니다. 어떤 제안?
다음은 데이터의 세 가지 예입니다.
C / O Bob Jones1071 Main St
주소를 입력하십시오. VERIFY64 Center Road
Joe 's Bakery33 Pleasant Ave # 4
이 방법으로 시도 할 수 있습니다.
library(dplyr)
library(stringr)
df %>%
mutate(V2 = str_extract_all(V1, "\\d+.*"))
# V1 V2
# 1 C/O Bob Jones1071 Main St 1071 Main St
# 2 PLEASE ADDRESS VERIFY64 Center Road 64 Center Road
# 3 Joes Bakery33 Pleasant Ave #4 33 Pleasant Ave #4
데이터
structure(list(V1 = c("C/O Bob Jones1071 Main St", "PLEASE ADDRESS VERIFY64 Center Road",
"Joes Bakery33 Pleasant Ave #4")), class = "data.frame", row.names = c(NA,
-3L))
이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.
침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제
몇 마디 만하겠습니다