何时使用单热编码,何时使用虚拟变量?

琪琪

我在这里有一个简短的问题。我想知道什么时候和什么情况下使用one-hot编码以及什么时候应该使用虚拟变量。

我打算用分类和数值变量进行聚类分析。我在一个论坛上读到我可以尝试使用 one-hot encoding 对分类变量进行编码。但我想知道是什么让它与虚拟变量不同。

谢谢

已退出--匿名-慕斯

大多数聚类算法都是基于距离的。

任何这样的编码都是一种让分类数据看起来像是数字的黑客,但这只会推迟由此产生的问题:如何规范化、加权、去相关和组合特征。

对于大多数聚类算法,无论您将虚拟编码为 0,1、0,100000 还是 0,0.000001,都会产生巨大的差异。那么你应该使用哪一个?对此没有客观的数学答案,它会导致严重的问题。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

何时使用Java单例

来自分类Dev

何时使用 $this 以及何时使用简单变量

来自分类Dev

何时使用共享变量

来自分类Dev

试图了解何时以及何时不使用单例

来自分类Dev

何时使用pthread条件变量?

来自分类Dev

何时使用全局变量

来自分类Dev

何时在变量分配中使用“ this”

来自分类Dev

何时使用自动释放变量?

来自分类Dev

何时在C ++中使用成员指针变量

来自分类Dev

何时在Swift中使用全局变量

来自分类Dev

在函数中定义变量时何时使用“ this”

来自分类Dev

何时使用TestClass实例变量与Pytest灯具

来自分类Dev

何时使用未赋值变量事件赋值?

来自分类Dev

何时在分类问题中采用虚拟变量?

来自分类Dev

何时使用ScreenAdapter以及何时使用Screen

来自分类Dev

何时使用对象以及何时使用数组

来自分类Dev

何时使用.shape和何时使用.reshape?

来自分类Dev

何时使用Dispose或何时使用Using

来自分类Dev

何时使用长度以及何时使用length()

来自分类Dev

何时使用Bpm以及何时使用esb

来自分类Dev

在PHP中,何时使用::和何时使用->

来自分类Dev

何时使用异常或何时使用消息?

来自分类Dev

在SQL中何时使用“ IS”以及何时使用“ =”

来自分类Dev

何时使用箭头,何时使用点?

来自分类Dev

何时使用IDataReader和何时使用DataReader?

来自分类Dev

何时使用Iterable,何时使用Iterator?

来自分类Dev

链接列表何时使用->以及何时使用。

来自分类Dev

何时使用length以及何时使用length()

来自分类Dev

在PHP中,何时使用::和何时使用->