Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

グラフのフォント

回帰分析を中心に色々な可視化方法(作図)を説明してきましたが、図(グラフ)の中には文字があります。グラフ中の文字について、どのようなフォントを使う一般論をまとめています。私自身はデータとそれを説明する科学的なモデルが重要だと思っているので…

DFFITS

回帰分析の診断方法の一つに、てこ比というものがあります。これをさらに拡張するとCookの距離やDFFITSといった指標に繋がります。 Cookの距離(Cook’s distance) Cook の距離はアメリカの統計学者 R. Dennis Cookの名にちなみます。彼は1977年にこの概念を導…

クックの距離(Cook’s distance)

回帰分析の診断方法の一つに、てこ比というものがあります。これをさらに拡張するとCook の距離やDFFITSといった指標に繋がります。今回はCookの距離について。 Cook の距離(Cook’s distance) Cook の距離はアメリカの統計学者 R. Dennis Cookの名にちなみま…

てこ比

今回はてこ比について。各観測値が推定値に与える影響、および全体の平均からどの程度ずれているかを示す指標で、0 から 1 までの値をとります。 モデル式(最小二乗法) まずはモデル式の多項式近似パラメータ推定について、最小二乗法で求めます。モデルは…

Doehlert計画

最適化計画の中で、Doehlert計画というものがあります。マイナーです。類似手法の中心複合計画やBox-Benken計画と比較してみます。 Doehlert計画 Doehlert計画はモデル式として多項式二次など曲面性を仮定して最適化を行う実験計画法(Design of Experiment, …

実験計画法の俯瞰図

様々な実験計画法の手法を俯瞰してみます。 俯瞰図 実験計画法には様々な手法があり、一見すると関係がよくわかりません。 分類法の一つとして、要因効果のモデルが上げられます。最も単純なものは交互作用がなく単一パラメータの効果の重ね合わせであるもの…

実験計画の相関マップとグラデーション色

実験計画の相関マップについてこちら で説明しましたが、相関マップのグラデーション色について気になり模様替えしてみました。 相関マップ 実験計画の相関マップは一部の統計ソフトに実装されています。実験水準の各変数間の相関係数を可視化したもので、よ…

実験計画の相関マップ

実験計画の各因子間の関係(交絡)を可視化する手法の一つとして相関マップがあります。各実験計画でマップ作成してみます。 相関マップ 実験計画の相関マップは一部の統計ソフトに実装されています。実験水準の各変数間の相関係数を可視化したものです。よ…

Plackett-Burman計画

ちょっと間がありましたが実験計画法です。主効果に寄与する因子スクリーニングのための実験計画であるブラケット・バーマン計画について。パレートの法則について紹介してみます。 ブラケット・バーマン計画 プラケット・バーマン(Plackett-Burman)計画は…

パレートの法則

経験則の一つですが、パレートの法則について紹介してみます。 パレートの法則 パレートの法則は、イタリアの経済学者ヴィルフレド・パレートが発見した冪乗則です。パレートは所得分布の不均衡を明らかにした際に、「社会全体の8割の富が2割の高額所得者に…

レーダーチャート(5)ー 背景

複数項目を一括表示出来るレーダーチャートの背景について。同心円状グラフで白一色の背景もありですが、少し工夫する余地があるので遊んでみましょう。 レーダーチャートの背景 レーダーチャートは複数特性値を持つ系列について各項目を一括で可視化するこ…

レーダーチャート(4)ー 進捗の比較

複数項目を一括表示出来るレーダーチャートですが、複数項目の達成度表示に応用する事も可能です。 レーダーチャートを使った達成度の確認 レーダーチャートは複数特性値を持つ系列について各項目を一括で可視化する手法です。応用例として複数項目の達成度…

レーダーチャート(3)ー 複数系列の比較

今回はレーダーチャートにおける複数系列の比較です。 レーダーチャートにおける複数系列比較 レーダーチャートは複数特性値を持つ系列について各項目を一括で可視化する手法ですが、複数系列について比較をしたい場合があります。 一番単純な方法としては一…

レーダーチャート(2)ー 並び順

今回はレーダーチャートの並び順について考えます。レーダーチャートの並び方を変えると印象がかなり変わります。 レーダーチャートの項目並び順 レーダーチャートの項目については並び順で印象は大きく変わります。下記をモチーフに考えてみます。 まずは、…

レーダーチャート

今回は、レーダーチャートについて述べます。多次元データの比較に用いられますが、全く異なるデータを0~1や0~100%に規格化して比較することが多いです。 レーダーチャートの基本 各項目の数量を中心点から多角形の頂点までの距離で表し、各頂点を結ぶと項目…

ステップワイズ法におけるAIC/BIC/Mallows's CPの比較

重回帰分析の変数選択をステップワイズ法で行った場合、変数選択の基準で結果が変わります。いくつか比較してみます。 変数選択基準の比較 重回帰分析のステップワイズ法などで用いられる変数選択の基準で、AIC/BIC/Mallows's CPを比較します。 下記のような…

ステップワイズ法

中心複合計画(Central Composite Design, CCD)やBox-Behnken計画(Box-Behnken Design, BBD) などで作成した計画は回帰分析により解析を行います。計画に用いた変数のうち応答に影響を与える変数を逐次求めるステップワイズ法を説明します。 回帰分析にお…

中心複合計画とBox-Behnken計画の比較

中心複合計画(Central Composite Design, CCD)とBox-Behnken計画(Box-Behnken Design, BBD) の比較をFDS/VDG plotを用いて行ってみます。 中心複合計画とBox-Behnken計画 中心複合計画では実験領域の頂点に置く実験点に加えて、星点(star point)と呼ば…

Box-Behnken計画

応答曲面のためのBox-Behnken(ボックスーベーンケン)計画を紹介します。中心複合計画のような2次以上のモデルのための計画ですが、効率的なサンプリングを行う側面があります。 Box-Behnken計画 Box-Behnken計画(Box Behnken, BBD)は1960年にGeorge E. P. …

内挿と外挿

内挿(interpolation)と外挿(extrapolation)について書きます。エンジニアをやっていると製品性能を推定する場面に出くわすことが多いです。この場合行っている事は、状況証拠を入力変数とし、自身の経験から構築したモデル式にこれを入力することによっ…

最適計画 - 各最適基準による計画の比較

応答曲面のための実験計画としてD最適などに代表される最適基準に基づいた最適計画を紹介しています。今回は、愚直に得られた実験計画を眺めて(比較して)みます。 各最適基準の比較 一例としてモデルは2次項、交互作用ありで、2変数5水準11試行のD,A,I,G最…

最適計画 - Variance Dispersion Graph(VDG)及びFraction of Design Space(FDS) plot

応答曲面のための実験計画としてD最適などに代表される最適基準に基づいた最適計画を紹介しましたが、得られた実験計画を評価する可視化手法があります。Variance dispersion graph(VDG)やFraction of Design Space plot(FDS)などです。 対象モデル 多項式近…

応答曲面法と最適計画

応答曲面法のためのサンプリング実験計画として中心複合計画があります。中心複合計画では実験計画範囲のみから実験点が決まりますが、実験計画範囲(計画点)とモデル式から最適基準を設けて、計算機支援で最適な実験計画を組む最適計画について述べます。D…

中心複合計画 - ツール

中心複合計画を作るツールを作成してみました。紹介します。 中心複合計画 中心複合計画は2次まで考慮した応答曲面法のための計画です。重回帰の予測精度が偏らないように、調整した実験計画が中心複合計画です。 メニューバー"DOE"から"Make Quadratic desi…

中心複合計画で乱数実験(4)- 交互作用について繰り返し数の影響

中心複合計画で繰り返し数を増やすと、どのように有意差が出やすくなるのかテストする続きです。 今回の対象は、応答が一次項と二乗項、さらに自身以外の変数との積和といった曲面性があるデータに、正規乱数を加えています。中心複合計画の中心点は0、軸点…

中心複合計画で乱数実験(3)- 繰り返し数の影響, 曲面性がある場合

中心複合計画で繰り返し数を増やすと、どのように有意差が出やすくなるのかテストする続きです。 今回の対象は、応答が説明変数の二乗和で曲面性があるデータに、正規乱数を加えています。中心複合計画の中心点は0、軸点以外の定義域は-1,1です。ノイズは標…

中心複合計画で乱数実験(2)ー 繰り返し数の影響, 曲面性がない場合

中心複合計画で繰り返し数を増やすと、どのように有意差が出やすくなるのかテストしてみます。 対象は、応答が説明変数の線形和で交互作用や曲面性がないデータで、正規乱数を足しています。中心複合計画の中心点は0、軸点以外の定義域は-1,1です。応答Yは説…

中心複合計画で乱数実験(1)ー 因子数の影響, 曲面性がない場合

中心複合計画で変数の数を増やすとどのように有意差が出やすくなるのかテストしてみます。 中心複合計画はロバストな手法ですが、要因数を増やした場合、有意差が出やすくなります。今回は、応答は説明変数の線形和で交互作用や曲面性がないデータに対し、正…

中心複合計画と応答曲面法

中心複合計画は応答曲面法のための実験です。今回は実験結果から応答曲面法のパラメータ計算を追ってみます。 応答曲面法 応答曲面(Response Surface)とは、予測変数(Predictor variables)から応答(Response)yを関係近似したものです。[math] \displa…

中心複合計画(Central Composite Design, CCD)

実験計画法は、どの因子が重要か選別するスクリーニング実験と、選別した因子に対して曲面性も考慮して行う最適化実験の2つに大別することが出来ます。前者は完全実施計画や直交表などが当てはまり、後者の代表的な手法が中心複合計画と呼ばれるものです。 …