Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

正規確率プロット縦軸表示方法

箱ひげ図と並んで、バラツキを含んだデータの代表的な可視化手法である正規確率プロットについて、縦軸表示の派生型を説明します。

 

正規確率プロット

正規確率プロットとはQ-Qプロット(quantile-quantile plot)の一種です。Q-Qプロットとは期待している確率分布と実データの対応を可視化したものです。大抵の場合我々は正規分布を期待するので、正規分布ベースの正規Q-Qプロット(正規確率プロット)を使うことが多いです。プロット結果が直線なら「期待した確率分布に従う」ということが言えます。

※故障確率で使うWeibull分布を使ったWeibull potや、半導体分野では電圧-電流特性が所望の特性か確認する***plot(fowler-nordheim plot, poole-frenkel plot)、Tr.特性バラツキに関するperglom plotなど「何とかプロット」というのは沢山あります。共通して言えるのはプロットが「考えているモデルが正しければ直線になるプロット」です。直線かどうかで視覚的にとらえやすくしています。

正規確率プロットの可視化方法

正規確率プロットでは横軸に計測値などの数値データをソートしたもの、縦軸に各点のパーセント或いは確率を表示します。ただし縦軸の表示は確率に対して線形ではなく、正規分布の累積密度関数の逆関数により変換したスケールを用います。正規分布の幅を決めるパラメータが標準偏差でこれをシグマという記号を使って表しますが、各確率が1シグマの何倍に相当するか計算します。

[math] \displaystyle Sigma = Normsinv(probability) [/math]

シグマ値は0シグマが確率0.5で、1シグマが確率0.68、2シグマが確率0.95、3シグマが確率0.997に相当します。こちら68–95–99.7則の記事に少し記載しています。

f:id:OceanOne:20220314005617p:plain
Fig.1 縦軸:シグマ
f:id:OceanOne:20220314005702p:plain
Fig.2 縦軸:確率

まとめ

今回の可視化方法は、こちらのツールに実装しています。論文ベースでは縦軸確率も多いですが、確率だと小数点の桁数表示が細かくなるので非効率的に思います。ただし、シグマと確率の相対関係を頭に入れておくのが前提なのでTPOを選んで使い分けるべきなのでしょうね。