Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

実験計画法(8)-直交表(2水準系)

これまでラテン方格やグレコ・ラテン方格について書きましたが、さらに一般化すると直交表実験に行き着きます。

直交表の概要

直交表(ちょっこうひょう)とは、実験の因子(パラメータ)のどの2つをとっても、その水準のすべての組み合わせが同数回現れるように出来ています。これを「直交している」と呼びます。

一般的な多元配置の実験(パラメータが沢山ある総当たり実験)では、因子の水準数の積の回数だけ実験数が必要になります。因子数が多くなると実験回数は膨大な数になります。ところが交互作用を考えない(正確には考慮する交互作用が少ない)場合、直交表を用いることによって実験回数を削減することができます。

直交表は沢山ありますが、一般的には[math] \displaystyle Ln [/math]という記号を用います.[math] \displaystyle L [/math]は直交表を表す記号でラテン方格(Latin square)に由来しています。[math] \displaystyle n [/math]は直交表の行数(実験の大きさ=実験回数)を示しています。

ラテン方格から直交表へ

[math] \displaystyle n=2 [/math]の最小のラテン方格は下記の通りです。

f:id:OceanOne:20200928035307p:plain:h80

上記の表から列番号を因子X0の水準、行番号を因子X1の水準、表内数値を因子X2の水準とした実験計画を考えます。これを全て書き下すと、全部で2x2=4条件の実験となります。

f:id:OceanOne:20200927013510p:plain

これが最小の直交表[math] \displaystyle L4 [/math]になります。直交表の名前にLatinのLが付いている通り、非常に関係が深く、[math] \displaystyle L4 [/math]の場合はラテン方格そのものです。

最小の直交表[math] \displaystyle L4 [/math]

[math] \displaystyle L4 [/math]は実験の大きさが最も小さい直交表で、下記になります。

f:id:OceanOne:20200927013510p:plain

実験回数は4回で、3因子についてそれぞれの水準数2で主効果を求めることができます。まずは直交表の性質、着目する因子を固定した場合に他の因子は同数回ずつ現れるを確認してみましょう。例えば因子X0に注目した場合、X1とX2は確かに同数回表れています。

f:id:OceanOne:20200927014142p:plain

X1に注目して、X0/X2を比較すると下記、

f:id:OceanOne:20200927014831p:plain

X2に注目しても、X0/X1を比較すると下記の通りになります。

f:id:OceanOne:20200927015242p:plain

確かに直交表の性質を満たしている(バランスしている)ことが分かります。

直交していることのメリット

直交していることのメリットはなんでしょうか?

実験計画法に基づいた結果を解析する場合には、着目因子に関する水準平均を計算します。つまり、着目因子以外の水準変更は無視して平均をとってしまえ!ということです。

試しに因子X0の水準平均を計算してみます。下記のような線形な関係を仮定します(最後の項は偶然誤差です)。

[math] \displaystyle y_{i} = \alpha \times x_{0} + \beta \times x_{1} + \gamma \times x_{2} + e_{i} [/math]

L4直交表は下記の通りなので、

f:id:OceanOne:20200928042009p:plain:h120 [math] \displaystyle y_{x_0=0} = \alpha \times (0+0)/2 + \beta \times (0+1)/2 + \gamma \times (0+1)/2 + (e_{1} + e_{2})/2 [/math]
[math] \displaystyle y_{x_0=1} = \alpha \times (1+1)/2 + \beta \times (0+1)/2 + \gamma \times (1+0)/2 + (e_{3} + e_{4})/2 [/math]

結局、下記の通りとなります。

[math] \displaystyle y_{x_0=0} = \alpha \times (0) + \beta \times (0.5) + \gamma \times (0.5) + (e_{1} + e_{2})/2 [/math]
[math] \displaystyle y_{x_0=1} = \alpha \times (1) + \beta \times (0.5) + \gamma \times (0.5) + (e_{3} + e_{4})/2 [/math]

重要なのは右辺第2項以降です。今回着目しているのは因子X0になりますが、それ以外の因子は出現回数が同数のため平均化すると、[math] \displaystyle y_{x_0=0} [/math]の場合も[math] \displaystyle y_{x_0=1} [/math]の場合も誤差項を除けば同じものになっています。


以上の性質は他の因子に関しても満たされます。つまり水準平均なんて他の因子を無視して乱暴な!と思ってしまいますが、他の因子を無視できるようにうまく調整したものが直交表なのです。

2水準系直交表のヴァリエーション

以上は2水準系の最小直交表[math] \displaystyle L4 [/math]に関する説明でしたが、実験を大きくすれば多くの因子を解析することができます。以下に2水準系の[math] \displaystyle L8 [/math][math] \displaystyle L12 [/math][math] \displaystyle L16 [/math]を示します。以下についても、今まで述べてきた性質、解析が適用可能です。

f:id:OceanOne:20200928044118p:plain:w210 f:id:OceanOne:20200928045045p:plain:w330 f:id:OceanOne:20200928045114p:plain:w450

まとめ

直交表説明の手始めにL4について説明しました。直交表につく"L"の由来や、直交していることのメリットを感じ取ってもらえればと思います。

例によってこちらのツールにも実装しています。メニューバー"DOE">Make DOE FileからDOEファイルの作成、Analyze DOE Fileから分散分析と水準平均の可視化を行うことができます。