因此,我花费了大量时间试图找到有关如何执行此操作的答案。到目前为止,我发现的唯一答案是:如何在不删除R中存在NA的行的情况下执行聚类
不幸的是,这对我不起作用。
因此,这是我的数据的一个示例(此示例中为d):
Q9Y6X2 NA -6.350055943 -5.78314068
Q9Y6X3 NA NA -5.78314068
Q9Y6X6 0.831273549 4.875151493 0.78671493
Q9Y6Y8 4.831273549 0.457298979 5.59406985
Q9Y6Z4 4.831273549 4.875151493 NA
这是我尝试过的:
> dist <- daisy(d,metric = "gower")
> hc <- hclust(dist)
Error in hclust(dist) : NA/NaN/Inf in foreign function call (arg 11)
从我的理解来看,雏菊应该能够处理NA值,但是在尝试对结果进行聚类时仍然出现错误。
谢谢。
如果查看dist矩阵,您会发现存在NA,因为样本Q9Y6X3和Q9Y6Z4没有重叠。这会在您的dist矩阵中产生NA,这是hclust不喜欢的。您可能会强制将NA设置为0或类似的值,但是我不确定这是否会留下统计偏差。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句