我正在通过对数据库中的对象进行编码(到 512 维向量中),然后对查询进行编码,最后使用 k-NN 算法来查找结果来构建语义搜索引擎。结果很好,但是..
我想尝试使用 Wikipedia 中的其他类别来扩充我的对象。所以对于每个对象,我可能会得到零个或多个额外的向量(取决于在维基百科中找到的单词数量)。
我的想法是numpy.average
在所有编码向量(每个对象)上使用,然后使用我的常规 k-NN 搜索。
这是最佳方法吗?我觉得平均向量可能不会得到准确的结果。
numpy.average
确实非常适合这项任务。我也对整体方法感到满意。我希望这些信息对某人有用。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句