ReLUを非表示レイヤーでのみ使用する必要があるのはなぜですか？

debugcn 投稿 Dev

IceRevenge

でこの記事私はReLUが唯一の隠された層に使用されるべきであることを読みました。なんでこんな感じなの？

回帰タスクのあるニューラルネットワークがあります。0から10までの数値を出力します。ReLUは0より小さい数値を返さないので、ここでは良い選択だと思いました。ここでの出力層に最適な活性化関数は何でしょうか。

dennlinger

通常、出力レイヤーには引き続きアクティブ化関数を使用できます。私は頻繁にシグモイド活性化関数を使用して出力を0-1の範囲で押しつぶしましたが、それは素晴らしい働きをしました。

ReLUを使用するときに考慮する必要がある理由の1つは、ReLUが死んだニューロンを生成する可能性があることです。つまり、特定の状況下では、ネットワークが更新されない領域を生成でき、出力は常に0になります。
基本的に、出力にReLUがある場合、勾配はまったくありません。詳細については、こちらを参照してください。。

初期化の際に注意していると、なぜそれが機能しないのかわかりません。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-08-11

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

ReLUを非表示レイヤーでのみ使用する必要があるのはなぜですか？

ReLUを非表示レイヤーでのみ使用する必要があるのはなぜですか？

境界線の色を表示する：「レイヤー」を通過する必要があるのはなぜですか

Javaで非デーモンスレッドを使用する必要があるのはなぜですか？

Fortranで「使用のみ」を使用する必要があるのはなぜですか

JavaのArrayListでイテレータを使用する必要があるのはなぜですか？

Chromeが変更時にレイヤー全体を再描画する必要がないのはなぜですか？

Chromeが変更時にレイヤー全体を再描画する必要がないのはなぜですか？

レイヤーマスクをサブビューに追加するときに、layoutIfNeeded() を呼び出す必要があるのはなぜですか?

conv2dレイヤーがndim = 4入力を必要とするのはなぜですか？

keras LSTM レイヤーが入力形状を必要とするのはなぜですか?

再起動時にワイヤレスドライバを再インストールする必要があるのはなぜですか？

Keras APIを使用して「入力レイヤーから非表示レイヤーへ」および「非表示レイヤーから出力レイヤーへ」の重みを抽出するにはどうすればよいですか？

SerializeFieldを使用する必要があるのはなぜですか？

SerializeFieldを使用する必要があるのはなぜですか？

chrootを使用する必要があるのはなぜですか

ターミナルからのみMySQLを使用する必要があるのはなぜですか？

Flutterでカードを使用する必要があるのはなぜですか？

埋め込みレイヤーの出力でドロップアウトを使用すると、配列の値が変わるのはなぜですか？

このC ++テンプレートでタイプを指定する必要があるのはなぜですか？

プレイヤーを動かすと、スプライトであるプレイヤーと風船が吃音するのはなぜだろうか。

イテレータは組み込み関数ではありませんが、なぜインポートする必要があるのですか？

依存関係でのみ使用されるマクロを使用する必要があるのはなぜですか

NgModuleのインポートでAlertModule.forRoot（）を使用する必要があるのはなぜですか？

「VToolbarItems」をインポートする必要があるのはなぜですか？

mobxでアクションデコレータを使用する必要があるのはなぜですか

「BurnRecovery」ツールを使用する必要があるのはなぜですか

Typescriptでインターフェイスを使用する必要があるのはなぜですか

通常のイテレータよりもforEachを優先する必要があるのはなぜですか？

ArcGIS API JSを使用したWMSレイヤーの読み込みが遅いのはなぜですか？

System.Data.Entityを使用するには、なぜEntity Frameworkのみを参照する必要があるのですか？