Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

多群の等分散性検定(2)ー Frigner-Killeen

多群のバラツキ同等性(等分散性)の検定にも、Bartlett/Levene/Brown-Forsythe検定などの他に順位統計量をもとにした母集団に特定の分布を仮定しないノンパラメトリックな検定が存在します。今回はそんなFrigner-Killeen検定[1]について紹介します。

Frigner-Killeen(フリグナー・キリーン)検定

Frigner-Killeen検定の検定量計算手順を追います。今回はFig.1にk群のテストデータを示します。Cond.1/2は平均50、標準偏差10の乱数を整数化したデータ、Cond.3は標準偏差30で同様に計算したデータです。各郡のデータ数は6です。まず、各郡の中央値を計算します。

f:id:OceanOne:20200728230850p:plain:w240
Fig.1 テストデータ

次に各郡の中央値との差分の絶対値を計算します、結果をFig.2に示します。

f:id:OceanOne:20200728231036p:plain:w180
Fig.2 各郡中央値との残差絶対値

変換後のデータを一旦全部まとめて、順位を計算します。エクセルなら[math] =RANK.AVG() [/math]が相当します。

f:id:OceanOne:20200728231515p:plain:w180
Fig.3 変換後データの順位

順位を計算したら、次式で正規確率プロットのようにシグマ変換します。変換結果をFig.4に示します。

[math] =NORMSINV( (\frac{Rank}{N_{all}+1}+1)/2 ) [/math]

f:id:OceanOne:20200728232105p:plain:w180
Fig.4 シグマ変換後のデータ

各郡のデータ数[math] n_i [/math]とシグマ変換後の平均値[math] \displaystyle mean_i [/math]を用いて[math] a_i = n_i (mean_i - mean_{all})^2 [/math]を計算します。

f:id:OceanOne:20200728232541p:plain:w240
Fig.5 変換後データの平均値など

全データから計算した分散[math] Var [/math]を用いて検定統計量[math] \displaystyle FK = \frac{\sum_{i=1}^{k}{a_i}}{Var} [/math]を計算します。この統計量が自由度[math] k-1 [/math]カイ二乗分布に従う事からP値を計算します。この例では、FK=10.0035、P_value=0.00673と有意な結果になります。

まとめ

等分散性検定についてノンパラメトリック版Frigner-Killeen検定の計算方法を紹介しました。こちらでは今回紹介した手法や同じく等分散性検定のBartlett/Levene/Brown-Forsythe/O'Brien検定などの結果を簡便に出力するプログラムを組んでいます。遊んでみてください。

[1] Fligner, M. A. and Killeen, T. J. (1976). Distribution-Free Two-Sample Tests for Scale. Journal of the American Statistical Association, 71, 210–213.

[2] Conover W J, Johnson M E, Johnson M M (1981) A comparative study of tests for homogeneity of variances, with applications to the outer continental shelf bidding data. Technometrics, 23, 351–361