목록에 포함되지 않은 경우 pandas 열에서 요소 제거

debugcn 에 게시 Dev

도구 칸 일 마즈

다음과 같은 목록이 있다고 가정 해 보겠습니다.

certificates = [ISO9001, ISO203, CE2234]

다음과 같은 데이터 프레임 :

company_certificates
[ISO303, ISO9001]
[GlobalGAP12, ISO203]
[EuroGAP]

인증서 목록에 포함되지 않은 경우 company_certificates에서 요소를 제거하고 싶습니다. 다음과 같이 할 수 있습니다.

df['company_certificates'] = df['company_certificates'].apply(lambda x: [i for i in x if i in certificates])

최종 출력은 다음과 같습니다.

company_certificates
[ISO9001]
[ISO203]
[]

하지만 내 데이터 프레임이 거대하기 때문에 더 효율적인 방법이 필요합니다. 어떤 아이디어?

E. 제이 틴치

data = {'company_certificates': [['ISO303', 'ISO9001'], ['GlobalGAP12', 'ISO203'], ['EuroGAP']]}
data['company_certificates'] *= 1000000

df = pd.DataFrame(data)
certificates = ['ISO9001', 'ISO203', 'CE2234']

# 3.1 s ± 134 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%%timeit
c2 = df['company_certificates'].tolist()
c1set = frozenset(certificates)
df['match'] = [[n for n in lst if n in c1set] for lst in c2]

# 4.32 s ± 578 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%%timeit
df['match'] = df['company_certificates'].apply(lambda x: [i for i in x if i in certificates])

# 7.23 s ± 616 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%%timeit
df['match'] = df['company_certificates'].apply(lambda x: list(set(x).intersection(certificates)))     

# 9.43 s ± 913 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
%%timeit
df['match'] = df['company_certificates'].apply(lambda x: list(filter(lambda y: y in x, certificates)))

# 32 s ± 2.11 s per loop (mean ± std. dev. of 7 runs, 1 loop each)
mask = ~df['company_certificates'].explode().isin(certificates).reset_index() \
               .groupby('index').any()['company_certificates']
df.loc[mask,'company_certificates'] = [[]*mask.sum()]

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-1

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

목록에 포함되지 않은 경우 pandas 열에서 요소 제거

목록에 포함되지 않은 경우 pandas 열에서 요소 제거

Pandas의 날짜 열에 특정 날짜가 포함되지 않은 경우 그룹 제거

Pandas Dataframe에서 전체 목록 행 제거-목록에 요소가 포함 된 경우 (이 경우 카드 한두 개)

목록간에 공유되지 않은 경우 목록에서 항목 제거

그것은 특정 문자가 포함 된 경우 목록 또는 세트에서 요소를 제거

목록에 특정 텍스트가 포함 된 경우 목록에서 요소 제거

주어진 요소를 포함하는 경우 목록에서 하위 목록 제거

패턴을 포함하지 않는 목록에서 요소 제거

문자열 / 기호가 포함 된 경우 배열에서 요소 제거

배열에서 정의되지 않은 요소 제거

목록 행에 SwiftUI의 textField가 포함 된 경우 foreach에서 요소를 제거 할 수 없습니다.

Pandas 열의 목록에서 요소 제거

다른 목록에 포함되지 않은 한 목록에서 요소를 삭제하는 방법은 무엇입니까?

다른 벡터에 포함되지 않은 키를 사용하여 맵에서 요소 제거

"IN"을 포함하지 않는 문자열 배열에서 모든 요소 제거

Pandas : 목록에있는 하나의 요소를 col2에 포함하지 않는 모든 그룹을 제거합니다.

Python : 목록과 하위 목록에서 중복 요소를 제거합니다. 중복되는 경우 전체 하위 목록 제거

Pandas Python은 조건이있는 목록에서 요소를 제거합니다.

요소에 "*"가 포함되지 않은 경우 jQuery를 사용하여 레이블에 "*"를 추가합니다.

요소에 "*"가 포함되지 않은 경우 jQuery를 사용하여 레이블에 "*"를 추가합니다.

행에 팬더의 패턴이 포함되지 않은 경우 groupby로 groupb 제거

사전에서 목록 요소를 검색하고 존재하지 않는 경우 삭제

다른 [JAVA / ANDROID]에 포함되지 않은 요소 목록 반환

목록 B에있는 항목이 A == B 인 경우에도 빈 목록을 반환하지 않는 경우 목록 A에서 모든 항목 제거

다른 목록에있는 경우 목록의 요소를 제거

아직 사용되지 않은 foreach의 배열에서 요소 제거

아직 사용되지 않은 foreach의 배열에서 요소 제거

데이터가 열에 기록되지 않은 경우 Python으로 CSV에서 행 제거

Javascript 매초 목록에서 요소를 제거하고 싶지만 제거되지 않습니다.

다른 목록에 포함되지 않은 경우에도 전체 목록을 표시하는 MS Access SQL

요소에 ""가 포함되지 않은 경우 jQuery를 사용하여 레이블에 ""를 추가합니다.

요소에 ""가 포함되지 않은 경우 jQuery를 사용하여 레이블에 ""를 추가합니다.