質問に戸惑いましたので、ご意見をお聞かせください。私はテンソルフローの畳み込みニューラルネットワークに取り組んでいます。これで、タグ付きの画像ができました。約10000個の固有のタグがあり、画像に自動的にタグを付けたいのですが。現在、ラベルに1つのホットエンコーディングを使用しています。10000の一意のタグの場合、機能の破損のようになります。どうすればそのような状況に対処できますか?
Facebookは顔のタグ付けでどのようにそれを行いますか?何百万もの顔があります。私は彼らが顔タグのために1つのホットエンコーディングをしないと思いますか?
顔認識では、何百万ものクラスを処理する標準的な方法は、埋め込みを使用することです。CNNは、64〜1024のサイズの埋め込みを生成します。
この埋め込みスペースでは、画像の各クラスが画像のクラスターを形成し、異なるクラスのクラスターが遠く離れている必要があります。
FacebookのアプローチはDeepFaceの論文(2014年6月)で説明されていますが、トリプレットロスを使用したGoogleのより最近のアプローチをお勧めします:FaceNet:顔認識とクラスタリングのための統合埋め込み。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加