Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

箱ひげ図(5)ー 比較円

箱ひげ図のオプションの一つですが比較円というものがあります。箱ひげ図は複数グループの応答を確認するものですが、どのグループ間に差があるのか明確には教えてくれません。複数グループのデータがあった場合に、どのグループ間に有意な差があるか教えてくれる検定に多重比較検定というものがあります。比較円は多重比較検定の結果を可視化するものです。

比較円

比較円は下図のように箱ひげ図の隣に比較データグループの数だけ円を描いて表します。

f:id:OceanOne:20200604001122j:plain:w400

この円はTukey-Kramerの多重比較検定を可視化したもので、円と円の相対関係で検定結果を表します。

多群のデータに対しては分散分析が良く用いられますが、分散分析の帰無仮説は「群間の全ての平均値が等しい」になります。例え有意になっても、どの群間に有意差があるかはわかりません。また、2群間の比較にはt検定がありますが、これを全ての2群間に適用することも検定の多重性の観点からNGです。多重比較検定は多群のどの群間に差があるか検定する専用の手法です。

f:id:OceanOne:20200604004954j:plain:w300
ちょうど有意差となる例

比較円について、上記に示すように二つの円を比較したとき円の中心と交点を結ぶ角度が90°以下の時に検定上有意な差があることを示します。

90°以下というのはどういう状況でしょうか。上図で[math] r_1 [/math]、[math] r_2 [/math]、[math] |\mu_1 - \mu_2| [/math]を辺とする三角形を考えた時に、[math] (\mu_1 - \mu_2)^2 \le {r_1}^2 + {r_2}^2 [/math] が成り立つ場合です。

[math] r_1 [/math]、[math] r_2 [/math]がそれぞれの群の平均値の推定精度を表し、それらの二乗和以上に平均値の差が大きいことになります。二乗和を考えるのは分散の加法性からです。

ですから、下記のような例は有意差あり、

f:id:OceanOne:20200605005022j:plain:w300
2群間に有意差がある比較円の例

次のような例は有意差なしになります。

f:id:OceanOne:20200605005142j:plain:w300
2群間に有意差がない比較円の例

終わりに

Tukey-Kramer法による比較円もこちらに実装してみています。遊んでみてください。