Python：如何使用Plotly堆叠或叠加直方图

anthonym650 发表于 Dev

320

anthonym650

我在单独的列表中有两组数据。每个列表元素的值都从0：100开始，元素重复。

例如：
first_data = [10,20,40,100,...,100,10,50]
second_data = [20,50,50,10,...,70,10,100]

我可以使用以下方式在直方图中绘制其中之一：

import plotly.graph_objects as go
.
.
.

fig = go.Figure()
fig.add_trace(go.Histogram(histfunc='count', x=first_data))
fig.show()

通过设置histfunc为'count'，我的直方图由0到100的x轴和表示中重复元素数的条形组成first_data。

我的问题是：如何使用相同的“计数”直方图在同一轴上覆盖第二组数据？

S3DEV

实现此目的的一种方法是，只需添加另一条迹线，您就快到了！可以在本文的最后部分找到用于创建这些示例的数据集。

注意：
以下代码使用“较低级别”的plotly API，因为（个人而言）我认为它更透明，并且使用户能够查看正在绘制的内容以及原因；而不是依靠graph_objectsand的便捷模块express。

选项1-叠加条：

from plotly.offline import plot

layout = {}
traces = []

traces.append({'x': data1, 'name': 'D1', 'opacity': 1.0})
traces.append({'x': data2, 'name': 'D2', 'opacity': 0.5})

# For each trace, add elements which are common to both.
for t in traces:
    t.update({'type': 'histogram',
              'histfunc': 'count',
              'nbinsx': 50})

layout['barmode'] = 'overlay'

plot({'data': traces, 'layout': layout})

输出1：

选项2-曲线图：

另一个选择是绘制分布曲线（高斯KDE），如下所示。值得注意的是，此方法绘制的是概率密度，而不是计数。

X1, Y1 = calc_curve(data1)
X2, Y2 = calc_curve(data2)

traces = []
traces.append({'x': X1, 'y': Y1, 'name': 'D1'})
traces.append({'x': X2, 'y': Y2, 'name': 'D2'})

plot({'data': traces})

输出2：

选项3-绘图条和曲线：

或者，您始终可以使用y轴上的概率密度将这两种方法结合在一起。

layout = {}
traces = []

traces.append({'x': data1, 'name': 'D1', 'opacity': 1.0})
traces.append({'x': data2, 'name': 'D2', 'opacity': 0.5})

for t in traces:
    t.update({'type': 'histogram',
              'histnorm': 'probability density',
              'nbinsx': 50})

traces.append({'x': X1, 'y': Y1, 'name': 'D1'})
traces.append({'x': X2, 'y': Y2, 'name': 'D2'})

layout['barmode'] = 'overlay'

plot({'data': traces, 'layout': layout})

输出3：

资料集：

这是一些代码，用于模拟[0,100]值的数据集并创建以下示例：

import numpy as np
from sklearn.preprocessing import MinMaxScaler

mms = MinMaxScaler((0, 100))
np.random.seed(4)
data1 = mms.fit_transform(np.random.randn(10000).reshape(-1, 1)).ravel()
data2 = mms.fit_transform(np.random.randn(10000).reshape(-1, 1)).ravel()

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。