LSTM-分离隐藏状态

debugcn 发表于 Dev

丹科

因此，我开始学习RNN，尤其是LSTM，并且其中的一部分理论我只是不了解。

当您堆叠LSTM单元格时，我看到每个人如何将隐藏状态从历史中分离出来，但这对我来说是没有意义的，LSTM是否不应该使用历史中的隐藏状态来做出更好的预测？

我阅读了文档，但对我来说仍然不清楚，因此欢迎任何解释

Frightera

没错，LSTM中的隐藏状态可以用作内存。但是这个问题出现了，我们应该学习它们吗？不，隐藏状态不是应该学习的，因此我们将其分离以使模型使用这些值但不计算梯度。

如果不分离，则渐变会很大。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-05-26

我来说两句

0条评论

登录后参与评论

来自分类Dev

对象状态可以从分离状态变为瞬态状态吗

来自分类Dev

LSTM网络学习

来自分类Dev

如何向量化LSTM？

来自分类Dev

TensorFlow LSTM生成模型

来自分类Dev

LSTM之后是平均池

来自分类Dev

TensorFlow：记住下一批的LSTM状态（有状态LSTM）

来自分类Dev

Keras有状态LSTM错误

来自分类Dev

在有和没有最终密集层的情况下训练多对多状态LSTM

来自分类Dev

LSTM预测直线

来自分类Dev

LSTM实施/过度拟合

来自分类Dev

keras LSTM处于隐藏状态（将sendece-sequence转换为文档上下文向量）

来自分类Dev

如何将初始隐藏状态传递给lstm层？

来自分类Dev

Keras LSTM在线学习

来自分类Dev

LSTM单元会去哪里？

来自分类Dev

修改残留的LSTM

来自分类Dev

针对状态LSTM模型的TensorFlow不同的输入和输出形状

来自分类Dev

通过示例了解LSTM

来自分类Dev

LSTM输入混乱

来自分类Dev

硬双向LSTM

来自分类Dev

在Keras中为每个具有不同隐藏大小和多个LSTM层的微型批处理设置隐藏状态

来自分类Dev

如何通过model.fit（）提取LSTM模型的细胞状态？

来自分类Dev

Tensorflow LSTM有状态选项无法保持批次之间的状态

来自分类Dev

在Keras中，训练有状态LSTM模型后，是否需要在预测值时重新训练模型？

来自分类Dev

如何恢复 Keras LSTM 状态

来自分类Dev

Keras LSTM 从各个序列恢复状态

来自分类Dev

Keras中LSTM中的多层隐藏层

来自分类Dev

Keras，无状态 LSTM

来自分类Dev

LSTM 隐藏状态维度有错误：RuntimeError: Expected hidden[0] size (4, 1, 256), got (1, 256)

来自分类Dev

如何在 Keras 摘要中显示所有 LSTM 状态？

Related 相关文章

文章