문자열의 부분 집합에 따라 조건부로 누락 된 값 채우기

DataProphets

누락 된 값이 포함 된 데이터 프레임이 있습니다. 이러한 결 측값은 여러 변수에 걸쳐 있지만 특정 관측치에서 한 번에 해당 변수에서 발생합니다. 예를 들어, 내 데이터 프레임은 다음과 같습니다.

r1 = c('', 'abc def', '')
r2 = c('1', 'ghi jkl', '2')
r3 = c('', 'mno pqr', '')
df = as.data.frame(rbind(r1, r2, r3))

df $ V2에 'def'가 포함 된 모든 경우에 누락 된 값을 모두 "x"로 채우고 df $ V2에 'pqr'이 포함 된 모든 경우에 누락 된 값을 모두 "y"로 채우고 모든 행은 그대로 둡니다. df $ V2에 'jkl'이 포함되어 있습니다. 즉, 다음과 같은 데이터 프레임으로 끝내고 싶습니다.

    V1  V2      V3
r1  x   abc def     x
r2  1   ghi jkl     2
r3  y   mno pqr     y

해당 행에있는 문자 변수 텍스트의 하위 집합을 기반으로 단일 행의 여러 열에있는 빈 셀을 조건부로 채우는 함수를 작성할 수 있습니까? 귀하의 도움에 감사드립니다.

소 토스

다음은 데이터 프레임, 값을 변경할 열, 일치시킬 열을 입력으로 취하는 함수입니다. 또한 패턴을 캡처하기 위해 두 개의 선택적 인수를 더 포함했습니다 (귀하의 경우 defx 및 pqry). 다른 모든 항목이 그대로 유지 될 것이라고 가정하여 값을 그대로 두는 세 번째 패턴을 생략했습니다. 원하는 경우 더 많은 패턴을 허용하도록 함수를 수정할 수 있습니다.

함수

f1 <- function(df, cols, match_with, to_x = 'def', to_y = 'pqr'){
  df[cols] <- lapply(df[cols], function(i) 
    ifelse(grepl(to_x, match_with, fixed = TRUE), 'x', 
           ifelse(grepl(to_y, match_with, fixed = TRUE), 'y', i)))
  return(df)
}

대다

#make sure your columns are characters and NOT factors
df[] <- lapply(df, as.character)

#apply the function
f1(df, cols = c('V1', 'V3'), match_with = df$V2)
#   V1      V2 V3
#r1  x abc def  x
#r2  1 ghi jkl  2
#r3  y mno pqr  y

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

해당 열 값의 집계에 따라 조건부로 NA 채우기

분류에서Dev

R에서 길고 넓은 데이터 셋의 형태를 변경하는 동안 조건부로 누락 된 값 채우기

분류에서Dev

R에서 누락 된 데이터를 조건부로 채우기

분류에서Dev

조건에 따라 파워 쿼리 결과 집합에 누락 된 값 추가

분류에서Dev

SQL : 조건부로 누락 된 레코드 채우기

분류에서Dev

참조로 data.table에 누락 된 값 채우기

분류에서Dev

조건부 기반의 열 값 변경 (누락 된 데이터 및 범주)

분류에서Dev

Postgres의 중앙값으로 누락 된 값 채우기

분류에서Dev

Flot에 대한 0 값으로 누락 된 배열 요소 채우기

분류에서Dev

결합, 누락 된 키 값 채우기

분류에서Dev

R에서 누락 된 값 채우기

분류에서Dev

값 채우기로 병합 (누락 된 항목 / 색인)

분류에서Dev

테이블 (R)에서 누락 된 열거 값 채우기

분류에서Dev

누락 된 필드를 아래 줄의 값으로 채우기

분류에서Dev

다른 열 (팬더)의 조건에 따라 null 값 채우기

분류에서Dev

누락 된 부분을 ID별로 최대 값으로 채우는 방법

분류에서Dev

열의 값에 따라 다른 함수를 사용하여 조건부로 그룹화 된 데이터 프레임을 집계합니다.

분류에서Dev

다른 열의 값을 기준으로 누락 된 값을 채우는 방법

분류에서Dev

조건에 따라 Nan 값 채우기

분류에서Dev

분기 별 데이터 프레임을 월별로 변환하고 Pandas에서 누락 된 값 채우기

분류에서Dev

R의 해당 행렬에있는 다른 행의 값으로 행렬의 누락 된 값 채우기

분류에서Dev

다른 데이터 프레임으로 열의 누락 된 값 채우기

분류에서Dev

여러 조건부 기준에 따라 열 값 할당

분류에서Dev

내부 배열 조건에 따라 배열 나누기

분류에서Dev

누락 된 값이있는 DataFrame 열을 문자열 값에서 부동 값으로 효율적으로 변환

분류에서Dev

두 개의 쉼표로 구분 된 문자열을 비교하고 누락 된 값 찾기

분류에서Dev

다른 열의 일부 기준에 따라 자동으로 열 채우기

분류에서Dev

모든 열에서 NA (누락 된 값)가있는 모든 행 부분 설정

분류에서Dev

R에서 조건부로 다른 열의 값 (동일한 행이 아님)의 값으로 열 값 채우기

Related 관련 기사

  1. 1

    해당 열 값의 집계에 따라 조건부로 NA 채우기

  2. 2

    R에서 길고 넓은 데이터 셋의 형태를 변경하는 동안 조건부로 누락 된 값 채우기

  3. 3

    R에서 누락 된 데이터를 조건부로 채우기

  4. 4

    조건에 따라 파워 쿼리 결과 집합에 누락 된 값 추가

  5. 5

    SQL : 조건부로 누락 된 레코드 채우기

  6. 6

    참조로 data.table에 누락 된 값 채우기

  7. 7

    조건부 기반의 열 값 변경 (누락 된 데이터 및 범주)

  8. 8

    Postgres의 중앙값으로 누락 된 값 채우기

  9. 9

    Flot에 대한 0 값으로 누락 된 배열 요소 채우기

  10. 10

    결합, 누락 된 키 값 채우기

  11. 11

    R에서 누락 된 값 채우기

  12. 12

    값 채우기로 병합 (누락 된 항목 / 색인)

  13. 13

    테이블 (R)에서 누락 된 열거 값 채우기

  14. 14

    누락 된 필드를 아래 줄의 값으로 채우기

  15. 15

    다른 열 (팬더)의 조건에 따라 null 값 채우기

  16. 16

    누락 된 부분을 ID별로 최대 값으로 채우는 방법

  17. 17

    열의 값에 따라 다른 함수를 사용하여 조건부로 그룹화 된 데이터 프레임을 집계합니다.

  18. 18

    다른 열의 값을 기준으로 누락 된 값을 채우는 방법

  19. 19

    조건에 따라 Nan 값 채우기

  20. 20

    분기 별 데이터 프레임을 월별로 변환하고 Pandas에서 누락 된 값 채우기

  21. 21

    R의 해당 행렬에있는 다른 행의 값으로 행렬의 누락 된 값 채우기

  22. 22

    다른 데이터 프레임으로 열의 누락 된 값 채우기

  23. 23

    여러 조건부 기준에 따라 열 값 할당

  24. 24

    내부 배열 조건에 따라 배열 나누기

  25. 25

    누락 된 값이있는 DataFrame 열을 문자열 값에서 부동 값으로 효율적으로 변환

  26. 26

    두 개의 쉼표로 구분 된 문자열을 비교하고 누락 된 값 찾기

  27. 27

    다른 열의 일부 기준에 따라 자동으로 열 채우기

  28. 28

    모든 열에서 NA (누락 된 값)가있는 모든 행 부분 설정

  29. 29

    R에서 조건부로 다른 열의 값 (동일한 행이 아님)의 값으로 열 값 채우기

뜨겁다태그

보관