Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

2021-01-01から1年間の記事一覧

68–95–99.7則

68–95–99.7則というものがあるみたいです。 1,2,3sigma 統計学において68–95–99.7則とは、平均値を中心として両側1sigma、2sigma、3sigmaの幅に入るデータの割合です。より正確には、68.27%、95.45%、 99.73%で、正規分布の累積密度関数から計算されます。 …

工程能力

工程能力指数(process capability index)のCpとCpkです。 管理限界線と規格値 工程管理では一番わかりやすいのはスペック=規格値と思います。それぞれ上限(USL)と下限(LSL)があります。次に管理線として中心線、および上方管理限界線(UCL)と下方…

ウォーターフォールチャートツール

自作したウォーターフォールチャートの使い方です。こちらの使い方になります。備忘録のようなものです。 ウォーターフォールチャートの使い方 起動後にFile>Open File(Waterfall)をクリックします。 可視化したいデータを指定するとウォーターフォールチャ…

ウォーターフォールチャート形状の派生型

ウォーターフォールチャートを表現する形状にはいくつか派生型があります。いくつか実装してみました、ツールも置いてあります。 ウォーターフォールチャート ウォーターフォールチャートは、数字の増減をわかりやすく表現できるグラフです。見た目が滝のよ…

ウォーターフォールチャートのカラーリング

ウォーターフォールチャートのカラーリングで遊んでみました。実装ツールも置いてあります。 ウォーターフォールチャート ウォーターフォールチャートは、数字の増減をわかりやすく表現できるグラフです。見た目が滝のように見えることからこの名前がつけら…

ウォーターフォールチャート

ウォーターフォールチャートについての説明と実装結果です。 ウォーターフォールチャート ウォーターフォールチャートは、数字の増減をわかりやすく表現できるグラフです。見た目が滝のように見えることからこの名前がつけられています。 ウォーターフォール…

ミッドレンジ

ミッドレンジについて特性を確かめてみます。 ミッドレンジ 統計学においてミッドレンジ(mid-range)は分布中心を推定する指標の一つにです。具体的には最大値と最小値の中心値(平均値)です。 この定義を聞いて想像される通り、ミッドレンジは外れ値に弱い…

標準偏回帰係数

重回帰の標準偏回帰係数についての説明と実装結果です。 標準偏回帰係数 重回帰分析を行った結果得られる、偏回帰係数つまり各説明変数の係数ですが、これはもちろん単位系や各説明変数の大小に依存します。例えば、測定単位を g から kg に変えると偏回帰係…

決定的スクリーニング計画をFDSプロットで比較

決定的スクリーニング計画を紹介していますが、実験計画の比較ツールであるFDSプロットで類似計画と比較してみます。 決定的スクリーニング計画と類似計画の比較 決定的スクリーニング計画(Definitive screening design, DSD)は2次の効果も推定できる最適…

決定的スクリーニング計画

実験計画法の中の、決定的スクリーニング計画について書きます。 決定的スクリーニング計画 まずスクリーニング計画とは、実験の初期段階で重要な因子を特定するための実験を少ない試行数で特定する計画です。決定的スクリーニング計画はモデル式として多項…

Quade検定

Quade(クェード)検定について記述します。 Quade(クェード)検定 Quade検定はFriedman検定と同様に、2元配置や乱塊法のようなブロック因子を考慮した対応のある1元配置の実験計画のノンパラメトリックな検定手法です。Quade検定はウィルコクソンの符号順…

Iman-Davenport検定

Friedman検定修正版のIman-Davenport(イマン・ダベンポート)検定です。 Iman-Davenport(イマン・ダベンポート)検定 Friedman検定はノンパラメトリック検定で、対応のある2群以上の多群の差を検定する手法です。Friedman検定の特徴として保守的である(=…

Friedman検定

Kruskal-Wallis検定に続いてFriedman検定です。実務でも使う機会は多いはずですが、Kruskal-Wallis検定が普通でないとFriedman検定は使わない気がします。でも適用機会は多いので。 Friedman検定 Friedman検定は、乱塊法のために開発された手法です。ノンパ…

Kruskal-Wallis検定

一元配置分散分析に対応するノンパラメトリック検定としてKruskal-Wallis検定があります。実務でも良く使う手法だと思います。が、これまで記事中で触れた事はあるのですが記事にしていないことに気づきました。ということで、Kruskal-Wallis検定です。 Krus…

グラフのフォント

回帰分析を中心に色々な可視化方法(作図)を説明してきましたが、図(グラフ)の中には文字があります。グラフ中の文字について、どのようなフォントを使う一般論をまとめています。私自身はデータとそれを説明する科学的なモデルが重要だと思っているので…

DFFITS

回帰分析の診断方法の一つに、てこ比というものがあります。これをさらに拡張するとCookの距離やDFFITSといった指標に繋がります。 Cookの距離(Cook’s distance) Cook の距離はアメリカの統計学者 R. Dennis Cookの名にちなみます。彼は1977年にこの概念を導…

クックの距離(Cook’s distance)

回帰分析の診断方法の一つに、てこ比というものがあります。これをさらに拡張するとCook の距離やDFFITSといった指標に繋がります。今回はCookの距離について。 Cook の距離(Cook’s distance) Cook の距離はアメリカの統計学者 R. Dennis Cookの名にちなみま…

てこ比

今回はてこ比について。各観測値が推定値に与える影響、および全体の平均からどの程度ずれているかを示す指標で、0 から 1 までの値をとります。 モデル式(最小二乗法) まずはモデル式の多項式近似パラメータ推定について、最小二乗法で求めます。モデルは…

Doehlert計画

最適化計画の中で、Doehlert計画というものがあります。マイナーです。類似手法の中心複合計画やBox-Benken計画と比較してみます。 Doehlert計画 Doehlert計画はモデル式として多項式二次など曲面性を仮定して最適化を行う実験計画法(Design of Experiment, …

実験計画法の俯瞰図

様々な実験計画法の手法を俯瞰してみます。 俯瞰図 実験計画法には様々な手法があり、一見すると関係がよくわかりません。 分類法の一つとして、要因効果のモデルが上げられます。最も単純なものは交互作用がなく単一パラメータの効果の重ね合わせであるもの…

実験計画の相関マップとグラデーション色

実験計画の相関マップについてこちら で説明しましたが、相関マップのグラデーション色について気になり模様替えしてみました。 相関マップ 実験計画の相関マップは一部の統計ソフトに実装されています。実験水準の各変数間の相関係数を可視化したもので、よ…

実験計画の相関マップ

実験計画の各因子間の関係(交絡)を可視化する手法の一つとして相関マップがあります。各実験計画でマップ作成してみます。 相関マップ 実験計画の相関マップは一部の統計ソフトに実装されています。実験水準の各変数間の相関係数を可視化したものです。よ…

Plackett-Burman計画

ちょっと間がありましたが実験計画法です。主効果に寄与する因子スクリーニングのための実験計画であるブラケット・バーマン計画について。パレートの法則について紹介してみます。 ブラケット・バーマン計画 プラケット・バーマン(Plackett-Burman)計画は…

パレートの法則

経験則の一つですが、パレートの法則について紹介してみます。 パレートの法則 パレートの法則は、イタリアの経済学者ヴィルフレド・パレートが発見した冪乗則です。パレートは所得分布の不均衡を明らかにした際に、「社会全体の8割の富が2割の高額所得者に…

レーダーチャート(5)ー 背景

複数項目を一括表示出来るレーダーチャートの背景について。同心円状グラフで白一色の背景もありですが、少し工夫する余地があるので遊んでみましょう。 レーダーチャートの背景 レーダーチャートは複数特性値を持つ系列について各項目を一括で可視化するこ…

レーダーチャート(4)ー 進捗の比較

複数項目を一括表示出来るレーダーチャートですが、複数項目の達成度表示に応用する事も可能です。 レーダーチャートを使った達成度の確認 レーダーチャートは複数特性値を持つ系列について各項目を一括で可視化する手法です。応用例として複数項目の達成度…

レーダーチャート(3)ー 複数系列の比較

今回はレーダーチャートにおける複数系列の比較です。 レーダーチャートにおける複数系列比較 レーダーチャートは複数特性値を持つ系列について各項目を一括で可視化する手法ですが、複数系列について比較をしたい場合があります。 一番単純な方法としては一…

レーダーチャート(2)ー 並び順

今回はレーダーチャートの並び順について考えます。レーダーチャートの並び方を変えると印象がかなり変わります。 レーダーチャートの項目並び順 レーダーチャートの項目については並び順で印象は大きく変わります。下記をモチーフに考えてみます。 まずは、…

レーダーチャート

今回は、レーダーチャートについて述べます。多次元データの比較に用いられますが、全く異なるデータを0~1や0~100%に規格化して比較することが多いです。 レーダーチャートの基本 各項目の数量を中心点から多角形の頂点までの距離で表し、各頂点を結ぶと項目…

ステップワイズ法におけるAIC/BIC/Mallows's CPの比較

重回帰分析の変数選択をステップワイズ法で行った場合、変数選択の基準で結果が変わります。いくつか比較してみます。 変数選択基準の比較 重回帰分析のステップワイズ法などで用いられる変数選択の基準で、AIC/BIC/Mallows's CPを比較します。 下記のような…