R에서 "문자"유형의 두 열을 기반으로 중복 된 행 제거

debugcn 에 게시 Dev

님조

데이터 프레임이 있고 두 개의 열 ( "Up"및 "Down")에 중복 된 문자열이있는 행을 제거하려고합니다. 일부 행에 2 개 열 중 1 개에만 중복 된 문자열 값이있는 경우 제거하면 안됩니다. 중복 된 행에서 다른 열 ( "접기"라는 이름)에서 발견 된 가장 높은 값을 가진 행을 유지하고 싶습니다. 이 태스크와 별도로 네 번째 열 ( "이름")에는 다음과 같은 일부 문자 대체가 필요합니다.

이것으로부터:

ID  Name                    Fold   Up           Down
1   mRNA_splicing(5)        3.2    a,b,c,d,e    f,g,h,i 
2   mRNA_processing(7)      3.1    a,b,c,d,e    f,g,h,i 
3   adherens_junctions(5)   2.6    k,l,m        p,q,r,s,t,u
4   glucose_transport(4)    3.4    d,j,n        o,p,v,w,z              
5   hexose_transport(2)     3.5    d,j,n        o,p,v,w,y,z

나는 이것을 얻고 싶다 :

ID  Name                    Fold   Up           Down
1   mRNA splicing           3.2    a,b,c,d,e    f,g,h,i  
2   adherens junctions      2.6    k,l,m        p,q,r,s,t,u
3   glucose transport       3.4    d,j,n        o,p,v,w,z              
4   hexose transport        3.5    d,j,n        o,p,v,w,y,z

중복 된 행을 제거 duplicate하거나 unique문자에 대해 작동 하지 않는 기능에 대해서는 여기서 어떻게해야합니까? 우아한 솔루션에 감사드립니다.

팀 비겔 라이젠

데이터 테이블 솔루션 사용 :

dt <- as.data.table(your_df)
dt <- dt[dt[, .I[Fold == max(Fold)], by=list(Up, Down)]$V1]
dt[["Name"]] <- gsub("_", " ", sub("\\(.*?\\)$", "", dt[["Name"]]))
dt

   ID               Name Fold        Up        Down
1:  1      mRNA splicing  3.2 a,b,c,d,e     f,g,h,i
2:  3 adherens junctions  2.6     k,l,m p,q,r,s,t,u
3:  4  glucose transport  3.4     d,j,n   o,p,v,w,z
4:  5   hexose transport  3.5     d,j,n o,p,v,w,y,z

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

R에서 "문자"유형의 두 열을 기반으로 중복 된 행 제거

R에서 "문자"유형의 두 열을 기반으로 중복 된 행 제거

행에서 중복 된 문자열 제거

R의 두 열을 기반으로 중복 제거

dataframe의 두 열 내에서 중복 된 문자열에 문자열을 추가

Regexp_replace : Oracle의 '+'로 구분 된 문자열에서 중복 제거

Ruby의 String # split 함수에서 고정 된 중복 제거 된 문자열을 반환 할 수 있습니까?

특수 문자로 구분 된 문자열에서 중복 및 NULL 제거

연결된 문자열에서 후행 구두점 제거

C ++ 부분 문자열의 부분 일치를 기반으로 벡터에서 문자열을 중복으로 제거

r에서 데이터 세트의 중복 된 열 문자 제거

문자열에서 중복 된 문자 제거

Pandas의 대칭 행렬을 기반으로 계열에서 중복 제거

문자열의 단어를 기반으로 DataFrame에서 행 제거

제한된 수의 문자 내에서 두 개의 열을 비교하고 중복을 지 웁니다.

두 개의 열과 세 번째 열의 조건을 기반으로 중복 행 제거

PHP에서 두 JSON 문자열의 차이점과 중복 제거?

다음 열의 가장 높은 값을 유지하면서 열을 기반으로 중복 행 제거

두 필드로 Postgres에서 중복 된 행을 제거하는 방법

세 개의 열을 기반으로 중복 행 제거

R에서 중복 된 연결 문자열을 제거하는 방법

입력 문자열에서 하위 문자열의 발생 항목을 반복적으로 제거 및 교체

쉼표로 구분 된 문자열의 단어 (앞뒤 공백 모두)에서 모든 후행 공백을 제거하려면 어떻게해야합니까?

쉼표로 구분 된 문자열의 단어 (앞뒤 공백 모두)에서 모든 후행 공백을 제거하려면 어떻게해야합니까?

중복 된 기본 값이있는 열거 형을 문자열 및 열거 형 사전으로 변환

중복 셀 및 두 번째 열 (VBA)의 내용을 기반으로 행 삭제

문자열에서 중복 된 문자 실행 확인

두 문자열의 오프셋을 기반으로 텍스트 섹션 제거

Bash의 문자열에서 중복 된 문자를 제거하는 방법은 무엇입니까?

중복 (두 줄)을 제거하고 하위 문자열을 기준으로 만 복제합니다.

문자열을 기반으로 SQL Server에서 중복을 제거하는 방법