パンダで箱ひげ図を描くために生成された統計データを取得する必要があります(データフレームを使用して箱ひげ図を作成します)。つまり、Quartile1、Quartile2、Quartile3、低いウィスカー値、高いウィスカー値、および外れ値。箱ひげ図を描くために次のクエリを試しました。
import pandas as pd
df = pd.DataFrame(np.random.rand(100, 5), columns=['A', 'B', 'C', 'D', 'E'])
pd.DataFrame.boxplot(df,return_type = 'both')
手動で値を計算する代わりにそれを行う方法はありますか?
1つのオプションは、プロットからのyデータを使用することです-おそらく外れ値(フライヤー)に最も役立ちます
_, bp = pd.DataFrame.boxplot(df, return_type='both')
outliers = [flier.get_ydata() for flier in bp["fliers"]]
boxes = [box.get_ydata() for box in bp["boxes"]]
medians = [median.get_ydata() for median in bp["medians"]]
whiskers = [whiskers.get_ydata() for whiskers in bp["whiskers"]]
ただし、いずれかを使用して他の値(IQRを含む)を取得する方がおそらく簡単です。
quantiles = df.quantile([0.01, 0.25, 0.5, 0.75, 0.99])
または、WoodChopperによって提案されたように
stats = df.describe()
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加