搜索

搜索

deeplearning4j嵌入层权重更新

debugcn 发表于 Dev

12

Sheng

我需要使用嵌入层来对单词向量进行编码，因此嵌入层的权重本质上是单词向量。显然，我不希望这种情况下的权重在反向传播期间进行更新。我的问题是，按设计嵌入层是否已经禁止了权重更新，还是我必须对此做一些特别的事情？

Sheng

在这里看一个老问题，

https://github.com/deeplearning4j/deeplearning4j/issues/3118

我认为满足我需要的一种方法是将学习率以及偏倚设置为0，即.biasInit(0.0).learningRate(0.0)，尽管我认为更好的方法（也可以从上面的链接中得到建议）是使用冻结层将其包裹起来？

编辑：我想我最终会得到如下解决方案，

new FrozenLayer.Builder().layer(new EmbeddingLayer.Builder().nIn(nIn).nOut(nOut).activate(Activate.IDENTITY).biasInit(0.0).build()).build()

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-6

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

Performance Encog与Deeplearning4J

来自分类Dev

deeplearning4j：在线Word2Vec培训

来自分类Dev

Intellij无法处理DeepLearning4j示例Maven项目

来自分类Dev

在deeplearning4j中实现张量流功能

来自分类Dev

使用 deeplearning4j 的 MNIST 示例代码错误

来自分类Dev

Deeplearning4j org.nd4j.linalg.factory.Nd4jBackend$NoAvailableBackendException

来自分类Dev

运行DeepLearning4J MNIST示例时出现java.lang.OutOfMemoryError

来自分类Dev

Deeplearning4j拆分数据集以进行测试和培训

来自分类Dev

在Deeplearning4j中加载keras模型时出错-Java

来自分类Dev

DeepLearning4J：形状在FeedForward自动编码器上不匹配

来自分类Dev

使用deeplearning4j对我自己的图像进行异常检测

来自分类Dev

线程“主”中的异常java.lang.NoClassDefFoundError：org / deeplearning4j / nn / conf / layers / Layer

来自分类Dev

启动服务器时可视化deeplearning4j中的培训进度会引发错误

来自分类Dev

如何减少使用 deeplearning4j（内存映射文件和 WorkspaceConfiguration）的程序中的 RAM 使用率？

来自分类Dev

Deeplearning4j-3层神经网络无法正确拟合

来自分类Dev

DL4J。执行 model.upgrade(Gradient) 后，权重是否更新？

来自分类Dev

如何使用数组值更新样式层权重

来自分类Dev

Deeplearning4j-如何填充RNN INDArray？

来自分类Dev

通过累加最后4层来嵌入BERT句子

来自分类Dev

使用反向分页对多层神经网络中的一个随机层进行权重更新？

来自分类Dev

有没有办法在训练步骤后直接更新层/变量的权重？

来自分类Dev

根据neo4j中的权重创建关系

来自分类Dev

用Java嵌入Neo4j

来自分类Dev

Caffe 嵌入层输入

来自分类Dev

提取嵌入层的输出

来自分类Dev

嵌入/嵌入层在深度学习中的用途

来自分类Dev

keras如何管理卷积层的权重？

来自分类Dev

设置卷积层的过滤器权重

来自分类Dev

Tensorflow中嵌入层的工作

Related 相关文章

文章

热门标签

归档