조건이 충족 될 때 ID를 기반으로 2 개의 데이터 프레임을 연결하는 방법은 무엇입니까?

debugcn 에 게시 Dev

프로그래밍 괴물

나는 완벽하게 작동하는 다른 데이터 프레임의 키워드를 기반으로 데이터 프레임에서 문장을 추출하려고 시도하고 있지만 다른 언어로 된 동일한 문장에 대한 다른 데이터 프레임이 있지만 동일한 시퀀스와 동일한 ID이므로 동일한 문장 형태를 추출하고 싶습니다. 다른 데이터 프레임뿐만 아니라 첫 번째의 일치 ID를 기반으로 어떤 종류의 작업을 수행 할 수 있습니까? 내가 시도하는 코드는 이것입니다


wdata = pd.read_csv(firstfile, nrows=0).columns[0]
skip = int(wdata.count(' ') == 0)
wdata = pd.read_csv(firstfile, names=['sentences'], skiprows=skip)

data = wdata['sentences'].str.replace('[^\w\s]', ' ')

tdata = pd.read_csv(secondfile, nrows=0).columns[0]
skip = int(tdata.count(' ') == 0)
tdata = pd.read_csv(secondfile, names=['sentences'], skiprows=skip)

sata = tdata['sentences'].str.replace('[^\w\s]', ' ')


keywords=pd.read_csv(dic)

keywords=keywords.loc[keywords['freq'].between(200, 2499, inclusive=False), 'word']


newdata = data[data.str.split(expand=True).isin(keywords.tolist()).any(axis=1)]


update = data[~data.str.split(expand=True).isin(keywords.tolist()).any(axis=1)]


newdata.to_csv("new_data.csv", index=False, header=False)

update.to_csv("update.csv", index=False, header=False)

----------------------
#first dataframe example 
----------------------
#how are you 
#I want to die
#I was home
#I went to sleep at work
#he have a bad reputation
#it was me who went to him 
#have  good sleep home

----------------------
#second  dataframe example 
----------------------
#halaw kuy bashii
#damawe bmrm 
#la malawa bum
#la esh nustm 
#aw kabraya bash nya 
#awa mn bum chum bo lay
#xaweki xosh basar bba la malawa 


----------------------
#the keyward example example 
----------------------
#word   freq
#and    500
#you    450
#me 300
#have   250
#your   240
#sleep  200
#work   150
#home   100
#die    50

이제이 코드는 첫 번째 데이터 프레임에서 원하는 문장을 제공하는 데 잘 작동하지만 조건이 true이고 데이터 프레임에서 첫 번째 문장을 가져 오는 경우와 같이 일치하는 ID를 기반으로 두 번째 데이터 프레임에서 문장을 잡는 방식으로 어떻게 할당 할 수 있습니까? 1을 새 csv 파일로 가져온 다음 데이터 프레임의 sendnece도 별도의 csv로 가져갑니다.

이것은 내가 얻는 코드입니다.

첫 번째 데이터 프레임 조건을 기반으로 동일한 ID를 얻고 두 번째 데이터 프레임에 대한 새 csv에도 덤프하고 싶습니다.

이스 르엘

동일한 수의 행과 두 DataFrame의 인덱스가 동일한 경우 다음과 DataFrame같이 마스크를 첫 번째 에서 두 번째 로 전달할 수 있습니다 .

print (data.index.equals(df2.index))
True

newdata2 = df2[data.str.split(expand=True).isin(keywords.tolist()).any(axis=1)]
print (newdata2)
                           sentences
0                   halaw kuy bashii
4               aw kabraya bash nya 
5             awa mn bum chum bo lay
6  xaweki xosh basar bba la malawa 1

색인으로 일치 시키려면 :

newdata = data[data.str.split(expand=True).isin(keywords.tolist()).any(axis=1)]
print (newdata)
0                  how are you 
4      he have a bad reputation
5    it was me who went to him 
6         have  good sleep home
Name: sentences, dtype: object

newdata2 = df2[df2.index.isin(newdata.index)]
print (newdata2)
                           sentences
0                   halaw kuy bashii
4               aw kabraya bash nya 
5             awa mn bum chum bo lay
6  xaweki xosh basar bba la malawa 1

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

조건이 충족 될 때 ID를 기반으로 2 개의 데이터 프레임을 연결하는 방법은 무엇입니까?

조건이 충족 될 때 ID를 기반으로 2 개의 데이터 프레임을 연결하는 방법은 무엇입니까?

조건이 충족 될 때까지 코 루틴을 기다리는 방법은 무엇입니까?

조건이 충족 될 때까지 코드를 지속적으로 다시 반복하는 방법은 무엇입니까?

내 부울 기준이 충족 될 때 바의 종가를 얻는 방법은 무엇입니까?

조건이 충족 될 때까지 수식 결과를 숨기는 방법

조건이 충족 될 때만 cor.test를 실행하는 방법은 무엇입니까?

두 개의 데이터 프레임 DF1과 DF2가 있습니다. 특정 인덱스에서 DF2에서 DF1에 조건부를 충족하는 행을 추가하는 가장 좋은 방법은 무엇입니까?

특정 조건이 충족 될 때 값 그룹을 삭제하는 방법은 무엇입니까?

특정 조건이 충족 될 때까지 효율적으로 스레드를 차단하는 방법

데이터 프레임에서 조건이 충족 될 때까지 누적 합계를 역방향

특정 조건이 충족 될 때까지 iOS 버튼의 작동을 중지하는 방법은 무엇입니까?

2 개의 다른 데이터 프레임에 대한 조건을 기반으로 열을 비교하여 2 개의 새 데이터 프레임을 만드는 방법은 무엇입니까?

조건이 충족 될 때 맵 함수 내부에서 객체로 값을 푸시하는 방법은 무엇입니까?

열 값이 데이터 프레임에 특정 수의 발생이없는 경우 해당 수를 충족 할 때까지 행을 무작위로 복제하는 방법은 무엇입니까?

조건을 충족하는 Pandas 데이터 프레임에서 데이터의 인덱스와 열을 찾는 방법은 무엇입니까?

Pandas 데이터 프레임의 마지막 행이 조건을 충족하는지 확인하는 가장 좋은 방법은 무엇입니까?

JSONPath를 사용하면 조건이 충족 될 때 2 개의 키-값 쌍만 가져옵니다.

PHP-조건이 충족 될 때까지 속성 값을 기반으로 객체를 배열로 구성

다른 데이터 프레임을 기반으로 데이터 프레임의 요소를 변경하는 방법은 무엇입니까?

기존 데이터 프레임의 dtypes를 기반으로 새 데이터 프레임을 만드는 방법은 무엇입니까?

R : if 조건이 충족 될 때 for 문을 중지하는 방법

두 개의 다른 사전의 데이터 프레임을 파이썬의 새 데이터 프레임으로 연결하는 방법은 무엇입니까?

조건이 충족 될 때까지 셀에서 수식 결과를 숨기는 방법-백분율 할인

조건이 충족 될 때 Sumproduct 연산을 수행하는 VBA에서 루프를 만드는 방법

데이터 프레임의 2 열 값을 다른 데이터 프레임의 ID로 대체하는 방법은 무엇입니까?

다른 데이터 프레임의 정보를 기반으로 R 데이터 프레임 열을 빼는 방법은 무엇입니까?

R에서 필요한 조건이 충족 될 때까지 매개 변수 세트에서 재귀 적 리샘플링하는 방법은 무엇입니까?

조건이 충족 될 때까지 데이터 프레임에서 행 제거

조건이 충족 될 때까지 방법 반복

조건이 충족 될 때까지 실행되는 루프를 작성하는 방법