다른 목록의 값을 기준으로 목록에서 값을 필터링하는 가장 효율적인 방법은 무엇입니까?

debugcn 에 게시 Dev

루카스 카우프만

현재 다음과 같은 목록을 만들었습니다.

stopfile = os.path.join(baseDir, inputPath, STOPWORDS_PATH)
stopwords = set(sc.textFile(stopfile).collect())
print 'These are the stopwords: %s' % stopwords

def tokenize(string):
    """ An implementation of input string tokenization that excludes stopwords
    Args:
        string (str): input string
    Returns:
        list: a list of tokens without stopwords
    """
    res = list()
    for word in simpleTokenize(string):
        if word not in stopwords:
            res.append(word)
    return res

simpleTokenize는 문자열 목록을 반환하는 문자열의 기본 분할 함수입니다.

맥시 무

이건 괜찮아. 좀 더 "Pythonic"방식 (4 대신 한 줄의 코드)으로 수행하려면 목록 이해를 사용할 수 있습니다.

res = [word for word in simpleTokenize(string) if word not in stopwords]

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-06-4

몇 마디 만하겠습니다

0리뷰

로그인참여 후 검토

Related 관련 기사

기사

다른 목록의 값을 기준으로 목록에서 값을 필터링하는 가장 효율적인 방법은 무엇입니까?

다른 목록의 값을 기준으로 목록에서 값을 필터링하는 가장 효율적인 방법은 무엇입니까?

목록의 값이 목록의 다른 값 중 하나에 포함되어 있는지 확인하는 가장 효율적인 방법은 무엇입니까?

인덱스 및 값 목록을 기반으로 튜플 목록을 필터링하는 가장 빠른 방법은 무엇입니까?

사전 목록에서 값을 편집하는 가장 효율적인 방법은 무엇입니까?

Firebase에서 데이터 목록을 구성하는 가장 효율적인 방법은 무엇입니까?

목록에서 반복되는 항목을 찾는 가장 효율적인 방법은 무엇입니까?

목록을 기반으로 pandas df에서 행을 삭제하는 가장 효율적인 방법은 무엇입니까?

값을 비교하기 위해 두 개의 다른 목록에서 동일한 인덱스 번호를 찾는 가장 효율적인 방법

data.table 열의 벡터 값을 다른 data.table의 상관 값으로 바꾸는 가장 효율적인 방법은 무엇입니까?

목록의 항목을 새 줄에 효율적으로 인쇄하는 방법은 무엇입니까?

Python에서 3 개 목록의 값을 비교하는 효율적인 방법은 무엇입니까?

Matlab에서 효율적인 방식으로 객체 목록에 하나의 값을 할당하는 방법은 무엇입니까?

미리 결정된 순서로 목록에 dict의 값을 반환하는 가장 효율적인 방법

2 개의 다른 목록의 값으로 하위 목록의 값을 얻는 방법은 무엇입니까?

오름차순 값을 기준으로 목록을 필터링하는 방법은 무엇입니까?

두 목록의 내용을 비교하는 가장 효율적인 방법은 무엇입니까?

Deedle-같은 행의 다른 열에있는 다른 항목의 값을 기준으로 열의 항목을 대체하는 가장 효율적인 (가장 빠른) 방법

값 목록에서 scipy 희소 행렬로 변환하는 가장 효율적인 방법은 무엇입니까?

목록의 값을 공간의 위치에 다른 값으로 삽입하는 방법은 무엇입니까?

목록에서 값 유형을 확인하는 가장 효율적인 방법

다른 목록의 중앙에서 목록을 분할하는 더 효율적인 방법이 있습니까?

목록 목록의 값을 다른 목록으로 바꾸는 방법은 무엇입니까?

pyspark에서 값을 null 값으로 임의로 변경하는 가장 효율적인 방법은 무엇입니까?

하위 목록의 모든 항목을 문자열로 변경하는 가장 효율적인 방법은 무엇입니까?

목록의 순서를 유지하는 다른 목록으로 목록을 검색하는 효율적인 방법이 있습니까?

개체 속성의 최대 값을 기준으로 개체 목록을 병합하는 가장 효율적인 방법

IQueryable에서 임의의 요소 목록을 효율적으로 검색하는 방법은 무엇입니까?

첫 번째 항목으로 배열을 정렬하는 가장 효율적인 방법은 무엇입니까?

Python에서 다른 여러 목록을 기반으로 목록을 필터링하는 방법은 무엇입니까?

2 개의 공통 키가있는 사전 목록에서 새 사전을 작성하는 가장 효율적인 방법은 무엇입니까?