Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

箱ひげ図 ー ボックス間の接続

箱ひげ図では条件間を平均値などで接続する場合があります。

 

箱ひげ図とボックス間の接続

箱ひげ図(Boxplot)とは、バラツキを含むデータを上手く要約して可視化したものです。

f:id:OceanOne:20220408005517p:plain

箱ひげ図の派生型の中で、平均値などで条件間を接続する場合があります。例えば箱ひげ図の箱の中央を形成する中央値を接続してみます。

f:id:OceanOne:20220408005558p:plain

箱ひげ図の定義から離れて平均値で条件間を接続するケースもあります。

f:id:OceanOne:20220408005713p:plain

他に平均値、中央値の代替となるものとして、トリム(刈り込み)平均もあります。トリム平均はデータをソートした後、両端A/2 %削除した後に平均を計算するもので、これをA%トリム平均などと呼びます。トリム平均は、外れ値がなければ最尤推定の平均値と、外れ値に頑健な中央値の、中庸な性質となります。下記に50%トリム平均で接続した結果を示します。

f:id:OceanOne:20220408010355p:plain

平均値、中央値、トリム平均全て表示すると下記、見慣れると生データの雰囲気も良そう出来るようになります。

f:id:OceanOne:20220408010434p:plain

箱ひげ図に本来表示されない平均値とその信頼区間を黒枠ひし形で表す場合があるので、箱ひげ図での条件間接続と一緒に表示すると下記です。少しわかりやすくなったと思いますが、如何でしょうか?

f:id:OceanOne:20220408010957p:plain

まとめ

箱ひげ図のヴァリエーションについて紹介しました。今回は条件ごとボックス間の中心地接続表示でした。今回のツールは、こちらのツールに置いています。