사전 훈련 된 모델이있는 gensim에서 wmdistance는 잘 작동하지만 n_similarity는 그렇지 않습니다.

debugcn 에 게시 Dev

유리 C

사전 훈련 된 모델로 gensim의 wmdistance () 기능을 사용하여 두 문장 사이의 거리를 계산했습니다.

자, 나는 그들 사이의 유사성을 원하고 n_similarity () funnction으로 시도했지만 keyerror가 발생했습니다.

keyerror : 어휘에없는 단어

오류 예의 스크린 샷을 보여줍니다.

누구든지 이것에 대해 아이디어가 있습니까?

고조모

단어가 어휘에 없다는 오류가 발생하면 해당 단어가 해당 모델에 없음을 의미합니다.

그것을 조회하려고 시도하면 KeyError존재하지 않는 단어 벡터를 얻으려고한다는 것을 알리기 위해를 생성합니다 .

토큰 목록을에 전달하기 전에 n_similarity()유효한 단어 만 포함하도록 필터링해야합니다 .

물론 이는 단어에 대해 의미있는 결과를 얻을 수 없음을 의미합니다 'selfie'. 마치 당신이 단어를 요청한 것처럼 모델에 알려지지 않은 넌센스 'asruhfglaiwurfliuawiufsdfsdfs'입니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정2021-04-2

0리뷰

로그인참여 후 검토

Related 관련 기사