gensim에서 생성 한 fasttext 모델을 바이너리 파일로 내보내는 방법은 무엇입니까?

Farhood ET

gensim에서 만든 fasttext 모델을 바이너리 파일로 내보내려고합니다. 그러나 문서는 이것을 달성하는 방법에 대해 명확하지 않습니다. 지금까지 내가 한 일 :

model.wv.save_word2vec_format('model.bin')

그러나 이것은 최선의 해결책이 아닌 것 같습니다. 나중에 다음을 사용하여 모델을로드하고 싶을 때부터 :

fasttext.load_facebook_model('model.bin')

나는 무한 루프에 들어간다. 로드하는 동안 함수에 fasttext.model의해 생성 된 model.save('fasttext.model)것은 약 30 초 안에 완료됩니다.

고조모

를 사용 .save_word2vec_format()하면 전체 단어 벡터 만 Google의 원래 word2vec.c릴리스 에서 사용 된 간단한 형식으로 저장됩니다 . 전체 FastText 모델에 대한 고유 한 것을 저장하지 않습니다. 이러한 파일은 일치하는 .load_word2vec_format().

.load_facebook_format()메서드는 Facebook의 원래 (비 Python) FastText 코드 릴리스에서 저장 한 형식으로 파일을로드합니다. ( '페이스 북'은 특정 데이터 형식 이외의 다른 많은 것을 의미 할 수 있기 때문에이 방법의 이름은 상당히 잘못되었습니다.) Gensim은 동일한 형식으로 저장하는 데 일치하는 방법이 없습니다. 구현하기가 매우 어렵고이 내보내기 옵션을 지원하는 대칭적인 의미가 있습니다.

Gensim의 모델은 일반적으로 Python 'pickle'직렬화와 원시 대형 배열 파일을 혼합하여 사용하는 gensim 네이티브 .save().load()옵션을 구현 합니다. 나중에 Gensim으로 다시로드하기 위해 전체 모델 상태를 저장하려는 경우 가장 좋은 옵션입니다.

(이러한 파일은 다른 FastText 구현에서로드 할 수 없습니다.)

.save()저장된 모델을 새 위치로 이동할 때 이것에 의해 작성된 여러 관련 파일 (모두 동일한 사용자 제공 접두사 포함)을 함께 보관하십시오.

업데이트 (2020 년 5 월) :gensim 3.8.3 이상과 같은 최신 버전 에는 FastText.save_facebook_model()원래 Facebook FastTExt 바이너리 형식으로 저장 하는 새로운 기여 방법이 포함되어 있습니다.

이 기사는 인터넷에서 수집됩니다. 재 인쇄 할 때 출처를 알려주십시오.

침해가 발생한 경우 연락 주시기 바랍니다[email protected] 삭제

에서 수정
0

몇 마디 만하겠습니다

0리뷰
로그인참여 후 검토

관련 기사

분류에서Dev

Git 속성에서 파일을 바이너리로 표시하는 적절한 방법은 무엇입니까?

분류에서Dev

pybind11에서 생성 한 바이너리 모듈을 가져 오는 방법은 무엇입니까?

분류에서Dev

한 컨테이너가 모바일보기에서 다른 컨테이너를 아래로 내리게하는 방법은 무엇입니까?

분류에서Dev

여러 바이너리 파일을 브라우저에 보내는 방법은 무엇입니까?

분류에서Dev

컴파일에 필요한 모든 라이브러리를 포함하는 Eclipse에서 Java 프로젝트를 내보내는 방법은 무엇입니까?

분류에서Dev

Python에서 루프가 돌아갈 때마다 새 변수를 생성 한 다음 처리 할 함수로 모두 보내는 방법은 무엇입니까?

분류에서Dev

내 모듈에 대한 QR 바를 자동으로 생성하는 방법은 무엇입니까?

분류에서Dev

BCC ATG에서 사용자가 생성 될 때 이메일을 보내는 방법은 무엇입니까?

분류에서Dev

내 React 코드 내에서 사용할 webpack 2 구성에서 파일을 생성 / 생성 / 내보내는 방법은 무엇입니까?

분류에서Dev

두 개의 실행 바이너리 파일이 동일한 소스 코드에서 생성되었는지 확인하는 방법은 무엇입니까?

분류에서Dev

여러 텍스트 파일을 한 줄씩 읽고 모든 파일 후에 새 열로 이동하여 Excel로 보내는 방법은 무엇입니까?

분류에서Dev

C에서 바이너리 파일을 구문 분석하는 성능적이고 깨끗한 방법은 무엇입니까?

분류에서Dev

mongodb를 다른 파일로 내보내는 모듈-올바른 방법은 무엇입니까? (nodejs에서)

분류에서Dev

자동 내보내기없이 셀레늄 웹 드라이버를 사용하여 Java에서 Har 파일을 생성하는 방법은 무엇입니까?

분류에서Dev

프랑스에 대한 문자열을 Microsoft Excel 파일로 내보내는 방법은 무엇입니까?

분류에서Dev

Julia에서 바이너리 파일을 읽는 방법은 무엇입니까?

분류에서Dev

maxBytes를 현재 datetime.log로 초과 한 후 rotateFileHandler에서 생성 할 로그 파일의 이름을 바꾸는 방법은 무엇입니까?

분류에서Dev

내 phonegap 빌드에 대한 p12 파일을 생성하는 방법은 무엇입니까?

분류에서Dev

내 pom.xml에서 .pom 파일을 생성하는 올바른 방법은 무엇입니까?

분류에서Dev

모델 생성기에 내장 된 레일을 패치하는 방법은 무엇입니까?

분류에서Dev

디렉토리 내에서 모든 바이너리 실행 파일을 재귀 적으로 찾는 방법은 무엇입니까?

분류에서Dev

생성 된 파일을 동일한 프로젝트 디렉토리에 저장하는 방법은 무엇입니까? 자바

분류에서Dev

OSX에서 생성 날짜별로 파일 이름을 바꾸는 방법은 무엇입니까?

분류에서Dev

Powershell에서 생성 한 파일을 잠금 해제 / 언로드하는 방법은 무엇입니까?

분류에서Dev

C 프로그램에서 생성 한 파이썬에서 복소수 파일을 여는 방법은 무엇입니까?

분류에서Dev

오류로 인해 'w'모드에서 파이썬 파일을 닫을 때 0 바이트 파일 생성을 피하는 방법은 무엇입니까?

분류에서Dev

Python에서 다중 처리로 여러 프로세스에서 생성 된 파일을 저장하는 가장 안전한 방법은 무엇입니까?

분류에서Dev

Linux Bash-다른 스크립트에서 생성 된 바이너리 파일 목록을 실행하는 방법은 무엇입니까?

분류에서Dev

nops_eval에서 생성 한 html 파일의 이름을 학생 ID로 지정하는 방법은 무엇입니까?

Related 관련 기사

  1. 1

    Git 속성에서 파일을 바이너리로 표시하는 적절한 방법은 무엇입니까?

  2. 2

    pybind11에서 생성 한 바이너리 모듈을 가져 오는 방법은 무엇입니까?

  3. 3

    한 컨테이너가 모바일보기에서 다른 컨테이너를 아래로 내리게하는 방법은 무엇입니까?

  4. 4

    여러 바이너리 파일을 브라우저에 보내는 방법은 무엇입니까?

  5. 5

    컴파일에 필요한 모든 라이브러리를 포함하는 Eclipse에서 Java 프로젝트를 내보내는 방법은 무엇입니까?

  6. 6

    Python에서 루프가 돌아갈 때마다 새 변수를 생성 한 다음 처리 할 함수로 모두 보내는 방법은 무엇입니까?

  7. 7

    내 모듈에 대한 QR 바를 자동으로 생성하는 방법은 무엇입니까?

  8. 8

    BCC ATG에서 사용자가 생성 될 때 이메일을 보내는 방법은 무엇입니까?

  9. 9

    내 React 코드 내에서 사용할 webpack 2 구성에서 파일을 생성 / 생성 / 내보내는 방법은 무엇입니까?

  10. 10

    두 개의 실행 바이너리 파일이 동일한 소스 코드에서 생성되었는지 확인하는 방법은 무엇입니까?

  11. 11

    여러 텍스트 파일을 한 줄씩 읽고 모든 파일 후에 새 열로 이동하여 Excel로 보내는 방법은 무엇입니까?

  12. 12

    C에서 바이너리 파일을 구문 분석하는 성능적이고 깨끗한 방법은 무엇입니까?

  13. 13

    mongodb를 다른 파일로 내보내는 모듈-올바른 방법은 무엇입니까? (nodejs에서)

  14. 14

    자동 내보내기없이 셀레늄 웹 드라이버를 사용하여 Java에서 Har 파일을 생성하는 방법은 무엇입니까?

  15. 15

    프랑스에 대한 문자열을 Microsoft Excel 파일로 내보내는 방법은 무엇입니까?

  16. 16

    Julia에서 바이너리 파일을 읽는 방법은 무엇입니까?

  17. 17

    maxBytes를 현재 datetime.log로 초과 한 후 rotateFileHandler에서 생성 할 로그 파일의 이름을 바꾸는 방법은 무엇입니까?

  18. 18

    내 phonegap 빌드에 대한 p12 파일을 생성하는 방법은 무엇입니까?

  19. 19

    내 pom.xml에서 .pom 파일을 생성하는 올바른 방법은 무엇입니까?

  20. 20

    모델 생성기에 내장 된 레일을 패치하는 방법은 무엇입니까?

  21. 21

    디렉토리 내에서 모든 바이너리 실행 파일을 재귀 적으로 찾는 방법은 무엇입니까?

  22. 22

    생성 된 파일을 동일한 프로젝트 디렉토리에 저장하는 방법은 무엇입니까? 자바

  23. 23

    OSX에서 생성 날짜별로 파일 이름을 바꾸는 방법은 무엇입니까?

  24. 24

    Powershell에서 생성 한 파일을 잠금 해제 / 언로드하는 방법은 무엇입니까?

  25. 25

    C 프로그램에서 생성 한 파이썬에서 복소수 파일을 여는 방법은 무엇입니까?

  26. 26

    오류로 인해 'w'모드에서 파이썬 파일을 닫을 때 0 바이트 파일 생성을 피하는 방법은 무엇입니까?

  27. 27

    Python에서 다중 처리로 여러 프로세스에서 생성 된 파일을 저장하는 가장 안전한 방법은 무엇입니까?

  28. 28

    Linux Bash-다른 스크립트에서 생성 된 바이너리 파일 목록을 실행하는 방법은 무엇입니까?

  29. 29

    nops_eval에서 생성 한 html 파일의 이름을 학생 ID로 지정하는 방법은 무엇입니까?

뜨겁다태그

보관