사전 훈련 된 모델이있는 gensim에서 wmdistance는 잘 작동하지만 n_similarity는 그렇지 않습니다.

유리 C

사전 훈련 된 모델로 gensim의 wmdistance () 기능을 사용하여 두 문장 사이의 거리를 계산했습니다.

자, 나는 그들 사이의 유사성을 원하고 n_similarity () funnction으로 시도했지만 keyerror가 발생했습니다.

keyerror : 어휘에없는 단어

오류 예의 스크린 샷을 보여줍니다. 오류 예시 스크린 샷

누구든지 이것에 대해 아이디어가 있습니까?

고조모

단어가 어휘에 없다는 오류가 발생하면 해당 단어가 해당 모델에 없음을 의미합니다.

그것을 조회하려고 시도하면 KeyError존재하지 않는 단어 벡터를 얻으려고한다는 것을 알리기 위해를 생성합니다 .

토큰 목록을에 전달하기 전에 n_similarity()유효한 단어 만 포함하도록 필터링해야합니다 .

물론 이는 단어에 대해 의미있는 결과를 얻을 수 없음을 의미합니다 'selfie'. 마치 당신이 단어를 요청한 것처럼 모델에 알려지지 않은 넌센스 'asruhfglaiwurfliuawiufsdfsdfs'입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

Related 관련 기사

뜨겁다태그

보관