Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

多群の等分散性検定(3)ー 検定手法の比較

多群の等分散性検定には様々な手法が存在します。対称データの違いで検定結果がどのように変わるのか体感するために、Bartlett/Hartley/Levene/Brown-Forsythe/O'Brien/Frigner-Killeen検定について比較を行ってみました。

検証方法

データは3群で2群は標準偏差1、残り1群の標準偏差を0.5~1.5まで0.05刻みで振っています。各郡のサンプルサイズは100データで、1000回ランダムに試行した結果のP値の平均をグラフ化しています。Fig.1に比較群も対象群も正規分布結果を示します。

f:id:OceanOne:20200801011611p:plain:w550
Fig.1 比較群:正規分布、対象群:正規分布

Fig.1の横軸は対象群の標準偏差で、1なら比較群と同じ分散になるのでP値は最も大きくなり、手法間の差はほとんどないように見えます。

f:id:OceanOne:20200801012239p:plain:w550
Fig.2 Fig.1拡大像

Fig.1を拡大してみると、Bartlett/Hartleyが敏感に反応しているようです。


次も同様に3群のデータについて比較2群は正規分布、対象1群は一様分布のデータをFig.3に示します。区間[0,1]の一様分布の標準偏差は[math] \frac{1}{\sqrt{12}}[/math]なので標準偏差1に相当する分布では区間[0,[math] \sqrt{12}[/math]]としています。

f:id:OceanOne:20200801012958p:plain:w550
Fig.3 比較群:正規分布、対象群:一様分布

Bartlett/Hartley/O'Brien検定は標本分散が計算のベースなので分布型が異なっても標本分散が同等なら有意差が出なくなるようで、対象群の標準偏差が1の箇所でP値が大きくなっています。またO'Brien検定はBartlett/Hartley検定よりP値が低く有意差が出やすいようです。一方Levene/Brown-Forsyce/Frigner-Killeen検定は標本分散からは計算されないため対象群の標準偏差が0.90~0.95くらいの箇所でP値が大きくなっており、一様分布の標準偏差が大きい側で有意差が出やすく、小さい側で有意差が出にくい結果です。

今度は比較2群を一様分布、対象1群を正規分布での同様のデータをFig.4に示します。

f:id:OceanOne:20200802003637p:plain:w550
Fig.4 比較群:一様分布、対象群:正規分布

当然Fig.4はFig.3を裏返したような結果になりますが、Levene/Brown-Forsyce検定とFrigner-Killeen検定についても差がありFrigner-Killeen検定が中庸な結果となっています。おそらく検定対象の群数が増えるほど差が開きそうです。

最後に比較2群も、対象1群も一様分布とした同様のデータをFig.5に示します。

f:id:OceanOne:20200802004935p:plain:w550
Fig.5 比較群:一様分布、対象群:一様分布

この結果ではBartlett/Hartley検定のP値が大きく(両手法はほぼ重なっています)他の手法より鈍感になっている様子が見て取れ、正規分布[]からの逸脱に弱いようです。残りの手法の中ではO'Brien/Frigner-Killeen検定(こちらもほぼ重なっています)がP値が低く感度が高いように見えます。

まとめ

多群の等分散性検定について正規分布/一様分布のテストデータを使って比較してみました。正規分布から外れてくると各手法の違いが出てきておもしろいです。