我目前正在使用Tensorflow Seq2seq模型,尝试实施情绪分析。我的想法是给编码器提供IMDB注释,给解码器提供[Pad]或[Go],向目标提供[neg] / [pos]。我的大部分代码与seq2seq转换示例非常相似。但是我得到的结果很奇怪。对于每个批次,结果要么全部为[neg],要么全部为[pos]。
“编码器输入:我几乎立刻就被迷住了。[pad] [pad] [pad]”
“解码器输入:[pad]”
“目标:[pos]”
由于这个结果非常特殊,我想知道是否有人知道会导致这种情况的原因?
我建议尝试使用更简单的体系结构-RNN或CNN编码器,将其输入到物流分类器中。这种架构在情感分析(亚马逊评论,Yelp评论等)上一直显示出很好的结果。
有关此类模型的示例,您可以在此处看到-文字和字符的各种编码器(LSTM或卷积)。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句