我一直在将箱线图和带状图与 seaborn 相结合,我注意到箱线图异常值通常比带状图显示的最大值具有更大的值。怎么会这样?箱线图异常值和带状图应该是真实的数据点,对吗?
这是我用来生成图形的代码:
data_long = pd.melt(data, id_vars=['var'])
sns.boxplot(x='value', y='var', data=data_long, hue='variable', orient='h',
order=sorted(values), palette='Set3')
sns.stripplot(x='value', y='var', data=data_long, hue='variable', orient='h', dodge=True, palette='Set3',
edgecolor='black', linewidth=1, jitter=True)
plt.semilogx(basex=2)
有人知道发生了什么吗?
致以最崇高的敬意。
当我让这个问题变得更好,试图摆脱那个 -1 时,我注意到我order=(values)
只有在箱线图中,这使得箱线图和带状图之间的数据不同。将order
参数也添加到条带图中可以解决问题。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句