Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

応答曲面法と最適計画

応答曲面法のためのサンプリング実験計画として中心複合計画があります。中心複合計画では実験計画範囲のみから実験点が決まりますが、実験計画範囲(計画点)とモデル式から最適基準を設けて、計算機支援で最適な実験計画を組む最適計画について述べます。D最適が有名で、A、I、G最適などがあります。

モデル式

多項式近似のパラメータは最小二乗法で求めることができます。モデルは下記で、以下データの数を[math] \displaystyle n [/math]、近似パラメータの数を[math] \displaystyle k [/math]とします。

[math] \displaystyle y ={\beta}_0 + \sum_{i=1}^{n}{{\beta}_i x_i} + \sum_{i<j}^{n}{{\beta}_{ij} {x_i}{x_j}} + \sum_{i=1}^{n}{{\beta}_{ii} {x_i}^2} [/math]

2変数の場合は下記の通り。

[math] \displaystyle y ={\beta}_0 + {\beta}_1 x_1 + {\beta}_2 x_2 + {\beta}_{3} {x_1}{x_2} + {\beta}_{4} {x_1}^2 + {\beta}_{5} {x_2}^2 [/math]

これを行列式で表します。

[math] \mathbf{y}=\left \{ \begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \end{matrix} \right \} [/math]

[math] \mathbf{X}=\left \{ \begin{matrix} 1 & x_{11} & x_{12} & \cdots & x_{1n} \\ 1 & x_{21} & x_{22} & \cdots & x_{2n} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_{n1} & x_{n2} & \cdots & x_{nn} \\ \end{matrix} \right \} [/math]

[math] \mathbf{\beta}=\left \{ \begin{matrix} \beta_1 \\ \beta_2 \\ \vdots \\ \beta_n \end{matrix} \right \} [/math]

[math] \mathbf{\varepsilon}=\left \{ \begin{matrix} \varepsilon_1 \\ \varepsilon_2 \\ \vdots \\ \varepsilon_n \end{matrix} \right \} [/math]

と置くと、近似モデルの行列式表示は下記のようになります。

[math] \displaystyle \mathbf{y}= \mathbf{X} \beta + \varepsilon [/math]

最小二乗法から[math] \displaystyle \mathbf{\beta} [/math]の推定値[math] \displaystyle \mathbf{b} [/math]が下記のように得られます。

[math] \displaystyle \mathbf{b}= (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} \mathbf{X}^{\mathit{T}} \mathbf{y} [/math]

このとき[math] \displaystyle \mathbf{b} [/math]の分散共分散行列は以下のようになります。

[math] \displaystyle V(\mathbf{b})= {\sigma}^2 (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} [/math]

このうち下記[math] \displaystyle \mathbf{M} [/math]は情報行列と呼ばれます。

[math] \displaystyle \mathbf{M}= \frac{(\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1}}{n} [/math]

最適基準の一覧

最適基準

実験計画評価の尺度として最適基準には様々なものがあります。ここでは詳細に入る前にまず俯瞰してみます。どの尺度も計算機で最小化(或いは最大化)問題として扱われるので、計算機上での評価関数が定義されています。評価関数は大きい方が良かったり(最大化)、小さい方が良かったり(最小化)して最適化されます。また0~1に規格化された効率も定義されていて、こちらは効率なので大きいほど良いに統一されています。

ラフに言うとD/A基準はモデルのパラメータ推定精度を重視、I/Gは応答の予測精度重視です。

Criterion Formula Efficiency
D [math] \displaystyle \mathrm{max} | \frac{(\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1}}{n} | [/math] [math] \displaystyle \frac{(|\mathbf{X}^{\mathit{T}} \mathbf{X}|)^{1/p}}{n} [/math]
A [math] \displaystyle \mathrm{min} [tr(M^{-1})] [/math] [math] \displaystyle \frac{p/n}{tr(M^{-1})} [/math]
I [math] \displaystyle \mathrm{min} [ \sum_{i=1}^{n_c} {x_i}^{\mathit{T}} (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} x_i] [/math] [math] [/math]
G [math] \displaystyle \mathrm{min} [ \max_{x_i\in{C}} {x_i}^{\mathit{T}} (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} x_i] [/math] [math] \displaystyle \frac{p/n}{ \max\_{x_i\in{C}} {x_i}^{\mathit{T}} (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} x_i } [/math]

D最適基準

D最適基準は情報行列の行列式(Determinant)を最大化する基準で、よく用いられる基準です。

[math] \displaystyle \mathrm{max} | \mathbf{M} | = \mathrm{max} | \frac{(\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1}}{n} | [/math]

この結果、[math] \displaystyle V(\mathbf{b}) [/math]を小さくしモデルパラメータの推定誤差を小さくすることが出来ます。

変数の座標範囲が −1~1 に正規化されている場合,D最適基準の優劣を表す Deff (D-efficiency) は次の式で表されます。

[math] \displaystyle Deff = \frac{(|\mathbf{X}^{\mathit{T}} \mathbf{X}|)^{1/p}}{n} [/math]

逆行列の各成分にはその行列の行列式の逆数が掛けられます。このためD 最適基準は [math] \displaystyle (\mathbf{X}^{\mathit{T}} \mathbf{X}) [/math]行列の行列式を最大化することで[math] \displaystyle {(\mathbf{X}^{\mathit{T}} \mathbf{X})}^{-1} [/math]行列の全成分を相対的に最小化することができます。これによって,D 最適基準は係数全体の分散を考慮した一般化分散を最小し、モデルパラメータの推定誤差を小さくすることが出来ます。

A最適基準

A最適基準もモデルパラメータの分散を最小化する最適基準です。情報行列の逆行列の対角成分の和 (trace)を最小化する最適基準です。A最適基準は各パラメータの平均分散を最小化することより"Average"から"A"のようです。

[math] \displaystyle \mathrm{min} [tr(M^{-1})] [/math]

A最適基準は情報行列の対角行列のみ考慮するため、D最適基準とは異なり共分散が大きくなる可能性があります。

D最適基準の場合と同様に、A最適基準の優劣を表す Aeff (A-efficiency) は次の式で表されます。

[math] \displaystyle Aeff = \frac{p/n}{tr(M^{-1})} [/math]

I最適基準

I最適基準は予測値の平均分散を最小化する観点からの最適基準です。設計変数空間で予測値分散を平均化することから"Integrated"の"I"のようです。

[math] \displaystyle \mathrm{min} [ \sum_{i=1}^{n_c} {x_i}^{\mathit{T}} (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} x_i] [/math]

G最適基準

G最適基準はI最適基準同様に予測値の分散を最小化する観点からの最適基準ですが、予測分散の最大値を最小化する最適基準です。

[math] \displaystyle \mathrm{min} [ \max_{x_i\in{C}} {x_i}^{\mathit{T}} (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} x_i] [/math]

D最適基準の場合と同様に、G最適基準の優劣を表す Geff (G-efficiency) は次の式で表されます。

[math] \displaystyle Geff = \frac{p/n}{ \max_{x_i\in{C}} {x_i}^{\mathit{T}} (\mathbf{X}^{\mathit{T}} \mathbf{X})^{-1} x_i } [/math]

まとめ

代表的な最適基準の計算方法を紹介しました。