短い手と地元の専門用語を多く含む非公式の英語テキストを分析する必要があります。したがって、スタンフォードタガーのモデルを作成することを考えていました。
スタンフォードタガーがトレーニングできるように、独自のラベル付きコーパスセットを作成するにはどうすればよいですか?
コーパスの構文とは何ですか?望ましいパフォーマンスを達成するためにコーパスはどのくらいの長さである必要がありますか?
PoSタガーをトレーニングするには、MaxentTaggerクラスのJavaDocsにも含まれているこのメーリングリストの投稿を参照してください。
edu.stanford.nlp.tagger.maxent.Trainクラスのjavadocs はトレーニング形式を指定します。
トレーニングファイルは、スペースまたはタブで区切られた1行につき1つの単語と1つのタグの形式である必要があります。各文はEOSの単語とタグのペアで終わる必要があります。(実際には、それが事実であるかどうかは完全にはわかりませんが、おそらく害はありません。-wmorgan)
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加