我们正在与Tensorflow合作。我们有大量的单词,品牌等数据集。我们正在尝试生成单词的后缀。例如,赋予'real'可以赋予'realtor','really','realestate',...。在我们的数据集中,每个单词都用\ n分隔。
到目前为止,我们已经尝试了几种方法,但是似乎没有产生足够的结果。在我看来,这是一个应该解决的相当简单的任务
我们正在研究的基本思想是适应char-rnn-tensorflow。我们只是简单地将采样更改为采样(具有加权随机概率),直到对回车进行采样为止。我们使用rnn_decoder和sequence_loss_by_example保留了原始实现,并使用rnn作为模型。
到目前为止,我们还没有获得好的样本,几乎是随机样本,有时还有后缀,但与词的开头没有任何关系(真实->真实位置)。可能是由于此实现未将单词分开,因此我们需要更简单的方法吗?
您将使用什么技术来完成这项任务?
最后,通过仔细调整网络参数并将温度应用于结果以获得一些好的建议,我们已经能够获得良好的结果。序列长度在训练过程中非常重要。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句