我有一个矩阵,其中每一行都填充到 maxlen。如果我在矩阵上应用 softmax,也会考虑填充索引。如何在仅考虑非填充索引的同时在矩阵上应用 softmax?
注意:矩阵每一行的填充长度会有所不同。
您可以将填充的单元格设置为接近 -Infinity 的值(即与其他 logits 相比非常小),这样它们的贡献就可以忽略不计。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
点击生成二维码
我来说两句