deeplearning4j嵌入层权重更新

Sheng

我需要使用嵌入层来对单词向量进行编码,因此嵌入层的权重本质上是单词向量。显然,我不希望这种情况下的权重在反向传播期间进行更新。我的问题是,按设计嵌入层是否已经禁止了权重更新,还是我必须对此做一些特别的事情?

Sheng

在这里看一个老问题,

https://github.com/deeplearning4j/deeplearning4j/issues/3118

我认为满足我需要的一种方法是将学习率以及偏倚设置为0,即.biasInit(0.0).learningRate(0.0),尽管我认为更好的方法(也可以从上面的链接中得到建议)是使用冻结层将其包裹起来?

编辑:我想我最终会得到如下解决方案,

new FrozenLayer.Builder().layer(new EmbeddingLayer.Builder().nIn(nIn).nOut(nOut).activate(Activate.IDENTITY).biasInit(0.0).build()).build()

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Performance Encog与Deeplearning4J

来自分类Dev

deeplearning4j:在线Word2Vec培训

来自分类Dev

Intellij无法处理DeepLearning4j示例Maven项目

来自分类Dev

在deeplearning4j中实现张量流功能

来自分类Dev

使用 deeplearning4j 的 MNIST 示例代码错误

来自分类Dev

Deeplearning4j org.nd4j.linalg.factory.Nd4jBackend$NoAvailableBackendException

来自分类Dev

运行DeepLearning4J MNIST示例时出现java.lang.OutOfMemoryError

来自分类Dev

Deeplearning4j拆分数据集以进行测试和培训

来自分类Dev

在Deeplearning4j中加载keras模型时出错-Java

来自分类Dev

DeepLearning4J:形状在FeedForward自动编码器上不匹配

来自分类Dev

使用deeplearning4j对我自己的图像进行异常检测

来自分类Dev

线程“主”中的异常java.lang.NoClassDefFoundError:org / deeplearning4j / nn / conf / layers / Layer

来自分类Dev

启动服务器时可视化deeplearning4j中的培训进度会引发错误

来自分类Dev

如何减少使用 deeplearning4j(内存映射文件和 WorkspaceConfiguration)的程序中的 RAM 使用率?

来自分类Dev

Deeplearning4j-3层神经网络无法正确拟合

来自分类Dev

DL4J。执行 model.upgrade(Gradient) 后,权重是否更新?

来自分类Dev

如何使用数组值更新样式层权重

来自分类Dev

Deeplearning4j-如何填充RNN INDArray?

来自分类Dev

通过累加最后4层来嵌入BERT句子

来自分类Dev

使用反向分页对多层神经网络中的一个随机层进行权重更新?

来自分类Dev

有没有办法在训练步骤后直接更新层/变量的权重?

来自分类Dev

根据neo4j中的权重创建关系

来自分类Dev

用Java嵌入Neo4j

来自分类Dev

Caffe 嵌入层输入

来自分类Dev

提取嵌入层的输出

来自分类Dev

嵌入/嵌入层在深度学习中的用途

来自分类Dev

keras如何管理卷积层的权重?

来自分类Dev

设置卷积层的过滤器权重

来自分类Dev

Tensorflow中嵌入层的工作

Related 相关文章

  1. 1

    Performance Encog与Deeplearning4J

  2. 2

    deeplearning4j:在线Word2Vec培训

  3. 3

    Intellij无法处理DeepLearning4j示例Maven项目

  4. 4

    在deeplearning4j中实现张量流功能

  5. 5

    使用 deeplearning4j 的 MNIST 示例代码错误

  6. 6

    Deeplearning4j org.nd4j.linalg.factory.Nd4jBackend$NoAvailableBackendException

  7. 7

    运行DeepLearning4J MNIST示例时出现java.lang.OutOfMemoryError

  8. 8

    Deeplearning4j拆分数据集以进行测试和培训

  9. 9

    在Deeplearning4j中加载keras模型时出错-Java

  10. 10

    DeepLearning4J:形状在FeedForward自动编码器上不匹配

  11. 11

    使用deeplearning4j对我自己的图像进行异常检测

  12. 12

    线程“主”中的异常java.lang.NoClassDefFoundError:org / deeplearning4j / nn / conf / layers / Layer

  13. 13

    启动服务器时可视化deeplearning4j中的培训进度会引发错误

  14. 14

    如何减少使用 deeplearning4j(内存映射文件和 WorkspaceConfiguration)的程序中的 RAM 使用率?

  15. 15

    Deeplearning4j-3层神经网络无法正确拟合

  16. 16

    DL4J。执行 model.upgrade(Gradient) 后,权重是否更新?

  17. 17

    如何使用数组值更新样式层权重

  18. 18

    Deeplearning4j-如何填充RNN INDArray?

  19. 19

    通过累加最后4层来嵌入BERT句子

  20. 20

    使用反向分页对多层神经网络中的一个随机层进行权重更新?

  21. 21

    有没有办法在训练步骤后直接更新层/变量的权重?

  22. 22

    根据neo4j中的权重创建关系

  23. 23

    用Java嵌入Neo4j

  24. 24

    Caffe 嵌入层输入

  25. 25

    提取嵌入层的输出

  26. 26

    嵌入/嵌入层在深度学习中的用途

  27. 27

    keras如何管理卷积层的权重?

  28. 28

    设置卷积层的过滤器权重

  29. 29

    Tensorflow中嵌入层的工作

热门标签

归档