Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

多重比較検定

多群のデータに対しては分散分析が良く用いられますが、分散分析の帰無仮説は「群間の全ての平均値が等しい」になります。例え有意になっても、どの群間に有意差があるかはわかりません。また、2群間の比較にはt検定がありますが、これを全ての2群間に適用することにも問題があります。本稿では検定の多重性のについて述べたあと、代表的な多重比較検定手法について説明します。

検定の多重性

さきほど述べたように多群であっても、2群比較の検定手法を組み合わせの数だけ繰り返せば良いように思われます。しかし、同一データで繰り返し検定を行うと多重性という問題が起こります。

例えば2群について1回の検定の有意水準を5%とすると、3群間内の2群で少なくとも1回有意と判定される確率は[math] 1-(1-0.05)^3 = 0.1426 [/math]になります。つまり5%のつもりの検定が、14%程度の検定になる計算です。

このケーススタディを7群まで行うと下図のようになります。6群で50%に到達し、2回に1回は有意と判定される計算となってしまいます。まずいですね・・・

f:id:OceanOne:20200606013840j:plain:w500
Fig.1 検定回数と有意水準

この検定の多重性を解決するために開発された手法が多重比較検定になります。

Tukey-Kramerの方法

多重比較検定の中では最も一般的な手法で、正規分布を仮定します。各2群の組み合わせを対比と呼び、対比毎に統計量を計算し有意差判定を行います。

  1. 群の数を[math] a [/math]、各群のデータ数を[math] n_i [/math]、全データ数を[math] N [/math]とする
  2. それぞれの群ごとに平均値[math]\bar{x_i}[/math]と分散[math] {\sigma}_i[/math]を計算
  3. 自由度[math] \phi_E [/math]を計算
  4. [math] \phi_E=N-a [/math]
  5. 誤差分散[math] V_E [/math]を計算
  6. [math] V_E= \displaystyle\frac{\sum_{i=1}^{a} (n_i-1) {\sigma}_i}{\phi_E} [/math]
  7. 統計量[math] t_{ij} [/math]を計算
  8. [math] t_{ij}= \displaystyle \frac{|\bar{x_i}-\bar{x_j}|}{ \sqrt{V_E(\frac{1}{n_i}+\frac{1}{n_j})} } \times \sqrt{2} [/math]
  9. スチューデント化された範囲の[math] \alpha [/math] %点 [math] q(a, \phi_E, \alpha) [/math]より有意差判定

Steel-Dwassの方法

Tukey-Kramerは正規分布を仮定しましたが、多重比較検定にもノンパラメトリック手法があり代表的なものをSteel-Dwassの方法になります。

  1. 群の数を[math] a [/math]、各群のデータ数を[math] n_i [/math]、全データ数を[math] N [/math]とする
  2. [math] i [/math]群と[math] j [/math]群のデータを合わせソートし順位[math] r_{ik} [/math]をつける
  3. 和[math] N_{ij} [/math]を計算
  4. [math] N_{ij}=n_i+n_j [/math]
  5. 順位和[math] R_{ij} [/math]を計算
  6. [math] R_{ij}=\sum_{k=1}^{n_i} r_{ik} [/math]
  7. 期待値[math] E(R_{ij}) [/math]を計算
  8. [math] E(R_{ij})= \displaystyle\frac{n_i(N_{ij}+1)}{2} [/math]
  9. 分散[math] V(R_{ij}) [/math]を計算
  10. [math] V(R_{ij}) = \displaystyle \frac{ {n_i}{n_j} }{ (N_{ij}) (N_{ij}-1) } \{ \sum_{k=1}^{n_i} r^2_{ik} + \sum_{k=1}^{n_j} r^2_{jk} - \frac{N_{ij} (N_{ij}+1)^2 }{4} \} [/math]
  11. 統計量[math] t_{ij} [/math]を計算
  12. [math] t_{ij}= \displaystyle \frac{|R_{ij}-E(R_{ij})|}{ \sqrt{V(R_{ij})} } \times \sqrt{2} [/math]
  13. スチューデント化された範囲の[math] \alpha [/math] %点 [math] q(a, \phi_E, \alpha) [/math]より有意差判定

終わりに

多重比較検定として代表的な、正規分布を仮定するTukey-Kramer法、ノンパラメトリックなSteel-Dwass法を紹介しました。ひとまずこの二つを平均値と中央値のような関係で押さえておけばよいと思います。

Tukey-Kramer法、Steel-Dwass法はこちらで実装しています。遊んでみてください。