Gensimでドキュメントに関するトピックを印刷するにはどうすればよいですか?

Awaldeep Singh

トピックモデリングにgensimでLDAを使用しています。私のデータには23のドキュメントがあり、ドキュメントごとに個別のトピック/単語が必要ですが、gensimはドキュメントのセット全体のトピックを一緒に提供しています。個々のドキュメント用に入手するにはどうすればよいですか?

dictionary = corpora.Dictionary(doc_clean)

# Converting list of documents (corpus) into Document Term Matrix using 
#dictionary prepared above.

corpus = [dictionary.doc2bow(doc) for doc in doc_clean]


# Creating the object for LDA model using gensim library
Lda = gensim.models.ldamodel.LdaModel

# Running and Trainign LDA model on the document term matrix.
ldamodel = Lda(corpus, num_topics=3, id2word = dictionary, passes=50)

result=ldamodel.print_topics(num_topics=3, num_words=3)

これは私が得ている出力です:

[(0, '0.011*"plex" + 0.010*"game" + 0.009*"racing"'),
(1, '0.008*"app" + 0.008*"live" + 0.007*"share"'),
(2, '0.015*"device" + 0.009*"file" + 0.008*"movie"')]
jhl

print_topics() トピックのリスト、そのトピックにロードされている単語、およびそれらの単語を返します。

ドキュメントごとにトピックを読み込む場合は、代わりにを使用する必要がありますget_document_topics()

gensimのドキュメントから


get_document_topics(bow, minimum_probability=None, minimum_phi_value=None, per_word_topics=False)

指定されたドキュメントのトピック分布を取得します。

パラメータ: bow (corpus : list of (int, float)) –BOW形式のドキュメント。minimum_probability (float)–このしきい値よりも低い確率が割り当てられたトピックは破棄されます。minimum_phi_value (float)-もしがper_word_topicsありTrue、これは下含まれている用語の確率にバインドさを表します。に設定するNoneと、値は1e-80を防ぐために使用されます。per_word_topics (bool)–の場合True、この関数は、「返品」セクションで説明されているように、2つの追加リストも返します。

戻り値:
list of (int, float) –ドキュメント全体のトピック分布。リスト内の各要素は、トピックのIDとそれに割り当てられた確率のペアです。

list of (int, list of (int, float)、オプション–単語ごとに最も可能性の高いトピック。リスト内の各要素は、単語のIDのペアと、この単語との関連性でソートされたトピックのリストです。per_word_topicsに設定されてTrueいる場合のみ返さます。

list of (int, list of float)、オプション–Phi単語とトピックの組み合わせごとに、関連性の値に長さを掛けたもの。リスト内の各要素は、単語のIDと、この単語と各トピックの間のphi値のリストのペアです。per_word_topicsに設定されてTrueいる場合のみ返さます。


get_term_topics()またget_topic_terms()、あなたにとって潜在的に興味深いかもしれません。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

gensim LDAを使用してドキュメントの完全なトピック配布を取得するにはどうすればよいですか?

分類Dev

ドキュメントを正しく印刷するにはどうすればよいですか?

分類Dev

Python Gensimの2つのドキュメント間のトピックの類似性をトピックの分布から比較するにはどうすればよいですか?

分類Dev

Microsoft .docxドキュメントのロックを解除するにはどうすればよいですか?

分類Dev

gensim 0.11.1のDoc2Vecからドキュメントベクトルを取得するにはどうすればよいですか?

分類Dev

LDAのトピックごとにすべてのドキュメントを表示するにはどうすればよいですか?

分類Dev

ピューマキル時にスレッドバックトレースを印刷するにはどうすればよいですか?

分類Dev

ドキュメントをiframeで動的にラップするにはどうすればよいですか?

分類Dev

mongoDBコレクションから100を超えるドキュメントをpromiseで印刷するにはどうすればよいですか?

分類Dev

RavenDbの関連ドキュメントフィールドで検索インデックスを作成するにはどうすればよいですか?

分類Dev

Jsonドキュメントに値が存在するかどうかのチェックを簡単にするにはどうすればよいですか?

分類Dev

既存のブックダウンドキュメントにebook関数epub_bookとkindlegen()を使用するにはどうすればよいですか?

分類Dev

ドキュメントがluceneインデックスに存在するかどうかを確認するにはどうすればよいですか?

分類Dev

メモ帳ドキュメントのテキストをテキストボックスに表示するにはどうすればよいですか

分類Dev

ドキュメントに関連する音声をアップロードするにはどうすればよいですか?

分類Dev

ドキュメントを開いた後に完全なドキュメントをリセットするにはどうすればよいですか?

分類Dev

HTMLドキュメントを印刷するときにページマージンを制御するにはどうすればよいですか?

分類Dev

ドキュメントスナップショットからfirestoreドキュメントIDを取得するにはどうすればよいですか?

分類Dev

1ページのLibreOfficeドキュメントを8部印刷して2枚の用紙に印刷するにはどうすればよいですか?

分類Dev

vscode pythonインタラクティブウィンドウに関数ドキュメントを表示するにはどうすればよいですか?

分類Dev

レポートドキュメントにパラメータを渡して直接印刷するにはどうすればよいですか

分類Dev

Wordで1ページのドキュメントを1枚のシートに複数回印刷するにはどうすればよいですか?

分類Dev

Mongooseで_idをdbドキュメントに設定するにはどうすればよいですか?

分類Dev

挿入後にIDでドキュメントを取得するにはどうすればよいですか?

分類Dev

Javaで文字列をXMLドキュメントに解析するにはどうすればよいですか?

分類Dev

forEach関数のmongodbドキュメントに属性が存在するかどうかを確認するにはどうすればよいですか?

分類Dev

Firebaseストアからドキュメントを取得するにはどうすればよいですか?

分類Dev

JXAで新しいドキュメントを作成するにはどうすればよいですか?

分類Dev

タイトルにドキュメントバージョンを印刷するにはどうすればよいですか?

Related 関連記事

  1. 1

    gensim LDAを使用してドキュメントの完全なトピック配布を取得するにはどうすればよいですか?

  2. 2

    ドキュメントを正しく印刷するにはどうすればよいですか?

  3. 3

    Python Gensimの2つのドキュメント間のトピックの類似性をトピックの分布から比較するにはどうすればよいですか?

  4. 4

    Microsoft .docxドキュメントのロックを解除するにはどうすればよいですか?

  5. 5

    gensim 0.11.1のDoc2Vecからドキュメントベクトルを取得するにはどうすればよいですか?

  6. 6

    LDAのトピックごとにすべてのドキュメントを表示するにはどうすればよいですか?

  7. 7

    ピューマキル時にスレッドバックトレースを印刷するにはどうすればよいですか?

  8. 8

    ドキュメントをiframeで動的にラップするにはどうすればよいですか?

  9. 9

    mongoDBコレクションから100を超えるドキュメントをpromiseで印刷するにはどうすればよいですか?

  10. 10

    RavenDbの関連ドキュメントフィールドで検索インデックスを作成するにはどうすればよいですか?

  11. 11

    Jsonドキュメントに値が存在するかどうかのチェックを簡単にするにはどうすればよいですか?

  12. 12

    既存のブックダウンドキュメントにebook関数epub_bookとkindlegen()を使用するにはどうすればよいですか?

  13. 13

    ドキュメントがluceneインデックスに存在するかどうかを確認するにはどうすればよいですか?

  14. 14

    メモ帳ドキュメントのテキストをテキストボックスに表示するにはどうすればよいですか

  15. 15

    ドキュメントに関連する音声をアップロードするにはどうすればよいですか?

  16. 16

    ドキュメントを開いた後に完全なドキュメントをリセットするにはどうすればよいですか?

  17. 17

    HTMLドキュメントを印刷するときにページマージンを制御するにはどうすればよいですか?

  18. 18

    ドキュメントスナップショットからfirestoreドキュメントIDを取得するにはどうすればよいですか?

  19. 19

    1ページのLibreOfficeドキュメントを8部印刷して2枚の用紙に印刷するにはどうすればよいですか?

  20. 20

    vscode pythonインタラクティブウィンドウに関数ドキュメントを表示するにはどうすればよいですか?

  21. 21

    レポートドキュメントにパラメータを渡して直接印刷するにはどうすればよいですか

  22. 22

    Wordで1ページのドキュメントを1枚のシートに複数回印刷するにはどうすればよいですか?

  23. 23

    Mongooseで_idをdbドキュメントに設定するにはどうすればよいですか?

  24. 24

    挿入後にIDでドキュメントを取得するにはどうすればよいですか?

  25. 25

    Javaで文字列をXMLドキュメントに解析するにはどうすればよいですか?

  26. 26

    forEach関数のmongodbドキュメントに属性が存在するかどうかを確認するにはどうすればよいですか?

  27. 27

    Firebaseストアからドキュメントを取得するにはどうすればよいですか?

  28. 28

    JXAで新しいドキュメントを作成するにはどうすればよいですか?

  29. 29

    タイトルにドキュメントバージョンを印刷するにはどうすればよいですか?

ホットタグ

アーカイブ