파이썬의 메모리 위치 반전 인덱스에서 단순

arm93

간단한 위치 인덱스를 만들려고하지만 올바른 출력을 얻는 데 문제가 있습니다.

문자열 (문장) 목록이 주어지면 sting 목록의 문자열 위치를 문서 ID로 사용한 다음 문장의 단어를 반복하고 문장의 단어 색인을 위치로 사용하고 싶습니다. 그런 다음 문서 ID의 튜플과 문서의 위치로 단어 사전을 업데이트합니다.

암호:

주요 기능-

def doc_pos_index(alist):
    inv_index= {}
    words = [word for line in alist for word in line.split(" ")]

    for word in words:
        if word not in inv_index:
            inv_index[word]=[]

    for item, index in enumerate(alist): # find item and it's index in list
        for item2, index2 in enumerate(alist[item]): # for words in string find word and it's index
            if item2 in inv_index:
                inv_index[i].append(tuple(index, index2)) # if word in index update it's list with tuple of doc index and position

    return inv_index 

예시 목록 :

doc_list= [
'hello Delivered dejection necessary objection do mr prevailed',
'hello Delivered dejection necessary objection do mr prevailed',
'hello Delivered dejection necessary objection do mr prevailed',
'hello Delivered dejection necessary objection do mr prevailed',
'hello Delivered dejection necessary objection do mr prevailed'
]

원하는 출력 :

{'Delivered': [(0,1),(1,1),(2,1),(3,1),(4,1)],
'necessary': [(0,3),(1,3),(2,3),(3,3),(4,3)], 
'dejection': [(0,2),(1,2),(2,2),(3,2),(4,2)],
 ect...}

전류 출력 :

{'Delivered': [],
'necessary': [], 
'dejection': [], 
'do': [],
'objection': [], 
'prevailed': [], 
'mr': [], 
'hello': []}

참고로, 컬렉션 라이브러리 및 NLTK에 대해 알고 있지만 주로 학습 / 연습 목적으로이 작업을 수행합니다.

mshsayem

이것을 확인하십시오 :

>>> result = {}
>>> for doc_id,doc in enumerate(doc_list):
        for word_pos,word in enumerate(doc.split()):
            result.setdefault(word,[]).append((doc_id,word_pos))


>>> result
{'Delivered': [(0, 1), (1, 1), (2, 1), (3, 1), (4, 1)], 'necessary': [(0, 3), (1, 3), (2, 3), (3, 3), (4, 3)], 'dejection': [(0, 2), (1, 2), (2, 2), (3, 2), (4, 2)], 'do': [(0, 5), (1, 5), (2, 5), (3, 5), (4, 5)], 'objection': [(0, 4), (1, 4), (2, 4), (3, 4), (4, 4)], 'prevailed': [(0, 7), (1, 7), (2, 7), (3, 7), (4, 7)], 'mr': [(0, 6), (1, 6), (2, 6), (3, 6), (4, 6)], 'hello': [(0, 0), (1, 0), (2, 0), (3, 0), (4, 0)]}
>>> 

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

반환 값을 반환하지 않는 파이썬 단위 테스트 패치 모의 메서드

분류에서Dev

사전 파이썬에서 값의 모든 인덱스 찾기

분류에서Dev

메모리 위치에 쓰는 액세스 위반 이유

분류에서Dev

파이썬 사전에서 반환 된 값의 임의 순서

분류에서Dev

오류 IndexError를 전달하는 방법 : 단일 위치 인덱서가 파이썬에서 범위를 벗어났습니다.

분류에서Dev

폴리머 단순 입력 스위치

분류에서Dev

다른 논리 프로세서로 인한 메모리 순서 위반에 대한 파이프 라인을 플러시하는 이유는 무엇입니까?

분류에서Dev

사전의 파이썬 순위 목록

분류에서Dev

토글 스위치 전환 너무 빨리 키보드 모듈 파이썬

분류에서Dev

파이썬에서 정렬 된 "오류"사전의 0 인덱스 위치에 열 이름을 ( "Error", "Count") 삽입하십시오.

분류에서Dev

파이썬 사전에서 단백질 그룹의 시작과 끝 위치를 계산

분류에서Dev

파이썬 사전의 항목을 무작위 순서로 반복하려면 어떻게해야합니까?

분류에서Dev

파이썬에 파일 위치 전달

분류에서Dev

파이썬의 인덱스를 기반으로 사전에서 필터링

분류에서Dev

파이썬에서 열의 인덱스 값 또는 값을 기반으로 쿼리

분류에서Dev

열 단위로 데이터 프레임 전치, 열 최소값 찾기 및 인덱스 반환

분류에서Dev

읽기 전용 메모리 페이지에서 연동 된 읽기가 액세스 위반을 트리거 함

분류에서Dev

단어로 된 글자의 파이썬 위치 주파수 사전

분류에서Dev

pip는 잘못된 버전의 파이썬에서 파이썬 라이브러리를 설치합니다.

분류에서Dev

단순 클래스 파일 생성시 메서드 서명에 대한 잘못된 상수 풀 인덱스

분류에서Dev

메모리 내 데이터베이스에서 인덱싱 된 열의 형식 안전성

분류에서Dev

퓨전 시트의 인덱스 순서 중단 Foundry 데이터 세트

분류에서Dev

파이썬에서 ms 단위의 13 자리 unixtime 타임 스탬프를 기반으로 타임 스탬프 계산

분류에서Dev

텍스트 파일에서 단어의 모든 반복 위치 (단어 수 기준)

분류에서Dev

onMarkerClick 메서드의 ArrayList <Object>에서 마커 인덱스 위치 가져 오기

분류에서Dev

파이썬은 열 범위의 일치를 기반으로 사전에서 값을 작성합니다.

분류에서Dev

파이썬에서 if 문 작성을 단순화하기 위해 일종의 진리표를 작성할 수 있습니까?

분류에서Dev

클래스 인스턴스의 메모리 위치를 직접 반환하면 어떻게됩니까?

분류에서Dev

고전적인 P (n, r)을 풀기위한 파이썬 코드 : 반복없이 r을 취한 n 개의 객체의 모든 순열을 인쇄합니다.

Related 관련 기사

  1. 1

    반환 값을 반환하지 않는 파이썬 단위 테스트 패치 모의 메서드

  2. 2

    사전 파이썬에서 값의 모든 인덱스 찾기

  3. 3

    메모리 위치에 쓰는 액세스 위반 이유

  4. 4

    파이썬 사전에서 반환 된 값의 임의 순서

  5. 5

    오류 IndexError를 전달하는 방법 : 단일 위치 인덱서가 파이썬에서 범위를 벗어났습니다.

  6. 6

    폴리머 단순 입력 스위치

  7. 7

    다른 논리 프로세서로 인한 메모리 순서 위반에 대한 파이프 라인을 플러시하는 이유는 무엇입니까?

  8. 8

    사전의 파이썬 순위 목록

  9. 9

    토글 스위치 전환 너무 빨리 키보드 모듈 파이썬

  10. 10

    파이썬에서 정렬 된 "오류"사전의 0 인덱스 위치에 열 이름을 ( "Error", "Count") 삽입하십시오.

  11. 11

    파이썬 사전에서 단백질 그룹의 시작과 끝 위치를 계산

  12. 12

    파이썬 사전의 항목을 무작위 순서로 반복하려면 어떻게해야합니까?

  13. 13

    파이썬에 파일 위치 전달

  14. 14

    파이썬의 인덱스를 기반으로 사전에서 필터링

  15. 15

    파이썬에서 열의 인덱스 값 또는 값을 기반으로 쿼리

  16. 16

    열 단위로 데이터 프레임 전치, 열 최소값 찾기 및 인덱스 반환

  17. 17

    읽기 전용 메모리 페이지에서 연동 된 읽기가 액세스 위반을 트리거 함

  18. 18

    단어로 된 글자의 파이썬 위치 주파수 사전

  19. 19

    pip는 잘못된 버전의 파이썬에서 파이썬 라이브러리를 설치합니다.

  20. 20

    단순 클래스 파일 생성시 메서드 서명에 대한 잘못된 상수 풀 인덱스

  21. 21

    메모리 내 데이터베이스에서 인덱싱 된 열의 형식 안전성

  22. 22

    퓨전 시트의 인덱스 순서 중단 Foundry 데이터 세트

  23. 23

    파이썬에서 ms 단위의 13 자리 unixtime 타임 스탬프를 기반으로 타임 스탬프 계산

  24. 24

    텍스트 파일에서 단어의 모든 반복 위치 (단어 수 기준)

  25. 25

    onMarkerClick 메서드의 ArrayList <Object>에서 마커 인덱스 위치 가져 오기

  26. 26

    파이썬은 열 범위의 일치를 기반으로 사전에서 값을 작성합니다.

  27. 27

    파이썬에서 if 문 작성을 단순화하기 위해 일종의 진리표를 작성할 수 있습니까?

  28. 28

    클래스 인스턴스의 메모리 위치를 직접 반환하면 어떻게됩니까?

  29. 29

    고전적인 P (n, r)을 풀기위한 파이썬 코드 : 반복없이 r을 취한 n 개의 객체의 모든 순열을 인쇄합니다.

뜨겁다태그

보관