ECT和Filter树(仅当您有大量输出标签(类)时才有用),例如N = 1000。使用OAA(相对于所有),这意味着每个示例都需要执行N个二进制分类任务(在培训和测试期间)。使用ECT,您可以使预测更快:log(N)。您可以将过滤树(这是ECT的基础)想象为决策树,其中在每个节点中询问示例是属于一组标签还是属于另一组标签(使用所有功能,与原始决策树不同)。
通常,ECT(在丢失或准确性方面)比OAA差(但在某些情况下,它可能与OAA几乎一样好)。对于N = 10的标签,您应该首先尝试OAA。当N> 1000时,OAA太慢(甚至精度也很低),您应该尝试ECT(如果可以预选与每个示例相关的较小数量的标签,则可以尝试ECT--log_multi
或--csoaa_ldf
VW)。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句