ReLUを非表示レイヤーでのみ使用する必要があるのはなぜですか?

IceRevenge

この記事私はReLUが唯一の隠された層に使用されるべきであることを読みました。なんでこんな感じなの?

回帰タスクのあるニューラルネットワークがあります。0から10までの数値を出力します。ReLUは0より小さい数値を返さないので、ここでは良い選択だと思いました。ここでの出力層に最適な活性化関数は何でしょうか。

dennlinger

通常、出力レイヤーには引き続きアクティブ化関数を使用できます。私は頻繁にシグモイド活性化関数を使用して出力を0-1の範囲で押しつぶしましたが、それは素晴らしい働きをしました。

ReLUを使用するときに考慮する必要がある理由の1つは、ReLUが死んだニューロンを生成する可能性があることです。つまり、特定の状況下では、ネットワークが更新されない領域を生成でき、出力は常に0になります。
基本的に、出力にReLUがある場合、勾配はまったくありません。詳細についてはこちら参照してください。 。

初期化の際に注意していると、なぜそれが機能しないのかわかりません。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

境界線の色を表示する:「レイヤー」を通過する必要があるのはなぜですか

分類Dev

Javaで非デーモンスレッドを使用する必要があるのはなぜですか?

分類Dev

Fortranで「使用のみ」を使用する必要があるのはなぜですか

分類Dev

JavaのArrayListでイテレータを使用する必要があるのはなぜですか?

分類Dev

Chromeが変更時にレイヤー全体を再描画する必要がないのはなぜですか?

分類Dev

Chromeが変更時にレイヤー全体を再描画する必要がないのはなぜですか?

分類Dev

レイヤーマスクをサブビューに追加するときに、layoutIfNeeded() を呼び出す必要があるのはなぜですか?

分類Dev

conv2dレイヤーがndim = 4入力を必要とするのはなぜですか?

分類Dev

keras LSTM レイヤーが入力形状を必要とするのはなぜですか?

分類Dev

再起動時にワイヤレスドライバを再インストールする必要があるのはなぜですか?

分類Dev

Keras APIを使用して「入力レイヤーから非表示レイヤーへ」および「非表示レイヤーから出力レイヤーへ」の重みを抽出するにはどうすればよいですか?

分類Dev

SerializeFieldを使用する必要があるのはなぜですか?

分類Dev

SerializeFieldを使用する必要があるのはなぜですか?

分類Dev

chrootを使用する必要があるのはなぜですか

分類Dev

ターミナルからのみMySQLを使用する必要があるのはなぜですか?

分類Dev

Flutterでカードを使用する必要があるのはなぜですか?

分類Dev

埋め込みレイヤーの出力でドロップアウトを使用すると、配列の値が変わるのはなぜですか?

分類Dev

このC ++テンプレートでタイプを指定する必要があるのはなぜですか?

分類Dev

プレイヤーを動かすと、スプライトであるプレイヤーと風船が吃音するのはなぜだろうか。

分類Dev

イテレータは組み込み関数ではありませんが、なぜインポートする必要があるのですか?

分類Dev

依存関係でのみ使用されるマクロを使用する必要があるのはなぜですか

分類Dev

NgModuleのインポートでAlertModule.forRoot()を使用する必要があるのはなぜですか?

分類Dev

「VToolbarItems」をインポートする必要があるのはなぜですか?

分類Dev

mobxでアクションデコレータを使用する必要があるのはなぜですか

分類Dev

「BurnRecovery」ツールを使用する必要があるのはなぜですか

分類Dev

Typescriptでインターフェイスを使用する必要があるのはなぜですか

分類Dev

通常のイテレータよりもforEachを優先する必要があるのはなぜですか?

分類Dev

ArcGIS API JSを使用したWMSレイヤーの読み込みが遅いのはなぜですか?

分類Dev

System.Data.Entityを使用するには、なぜEntity Frameworkのみを参照する必要があるのですか?

Related 関連記事

  1. 1

    境界線の色を表示する:「レイヤー」を通過する必要があるのはなぜですか

  2. 2

    Javaで非デーモンスレッドを使用する必要があるのはなぜですか?

  3. 3

    Fortranで「使用のみ」を使用する必要があるのはなぜですか

  4. 4

    JavaのArrayListでイテレータを使用する必要があるのはなぜですか?

  5. 5

    Chromeが変更時にレイヤー全体を再描画する必要がないのはなぜですか?

  6. 6

    Chromeが変更時にレイヤー全体を再描画する必要がないのはなぜですか?

  7. 7

    レイヤーマスクをサブビューに追加するときに、layoutIfNeeded() を呼び出す必要があるのはなぜですか?

  8. 8

    conv2dレイヤーがndim = 4入力を必要とするのはなぜですか?

  9. 9

    keras LSTM レイヤーが入力形状を必要とするのはなぜですか?

  10. 10

    再起動時にワイヤレスドライバを再インストールする必要があるのはなぜですか?

  11. 11

    Keras APIを使用して「入力レイヤーから非表示レイヤーへ」および「非表示レイヤーから出力レイヤーへ」の重みを抽出するにはどうすればよいですか?

  12. 12

    SerializeFieldを使用する必要があるのはなぜですか?

  13. 13

    SerializeFieldを使用する必要があるのはなぜですか?

  14. 14

    chrootを使用する必要があるのはなぜですか

  15. 15

    ターミナルからのみMySQLを使用する必要があるのはなぜですか?

  16. 16

    Flutterでカードを使用する必要があるのはなぜですか?

  17. 17

    埋め込みレイヤーの出力でドロップアウトを使用すると、配列の値が変わるのはなぜですか?

  18. 18

    このC ++テンプレートでタイプを指定する必要があるのはなぜですか?

  19. 19

    プレイヤーを動かすと、スプライトであるプレイヤーと風船が吃音するのはなぜだろうか。

  20. 20

    イテレータは組み込み関数ではありませんが、なぜインポートする必要があるのですか?

  21. 21

    依存関係でのみ使用されるマクロを使用する必要があるのはなぜですか

  22. 22

    NgModuleのインポートでAlertModule.forRoot()を使用する必要があるのはなぜですか?

  23. 23

    「VToolbarItems」をインポートする必要があるのはなぜですか?

  24. 24

    mobxでアクションデコレータを使用する必要があるのはなぜですか

  25. 25

    「BurnRecovery」ツールを使用する必要があるのはなぜですか

  26. 26

    Typescriptでインターフェイスを使用する必要があるのはなぜですか

  27. 27

    通常のイテレータよりもforEachを優先する必要があるのはなぜですか?

  28. 28

    ArcGIS API JSを使用したWMSレイヤーの読み込みが遅いのはなぜですか?

  29. 29

    System.Data.Entityを使用するには、なぜEntity Frameworkのみを参照する必要があるのですか?

ホットタグ

アーカイブ