Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

単回帰分析結果のカラーリング

シンプルな単回帰分析結果ですが、なんでもそうですが普段やりなれていない方には取りつきにくいものです。今回は見た目とカラーリングで遊んでみます。

まずは単回帰分析

単回帰分析の第1のアウトプットはXとYの直線関係を推定することです。例えば、下図のような感じです。

f:id:OceanOne:20200816035808p:plain:w400

単回帰分析の第2のアウトプットは予測精度を教えてくれることです。予測精度については2種類あり、推定した直線関係の精度(回帰直線の信頼区間)と得られた線形関係の元で実際にデータが散らばる範囲(予測区間)があります。

下図では信頼区間を濃いめのピンクの実線で、予測区間を淡いピンクのバンドで示してみました。P値は0.05の結果です。

f:id:OceanOne:20200816040041p:plain:w400

予測区間とデータ点(黒)を比較すると、確かにほぼバンド内に収まっていることがわかります。


一方の回帰直線の信頼区間について、今度はP値を0.1、0.01、0.001、0.0001、0.00001、0.000001で振った結果が下図です。0.000001というと丁度1ppm(parts per million)ですね。

f:id:OceanOne:20200816040730p:plain:w400

(余談)1ppmなんて言うと研究分野によっては想定外かも知れませんが、半導体製造分野ではザラです。例えば皆さんの携帯に256GByteの記憶素子があったとして(1Byte=8bit)、256GB=256x10^9x8=2048000000000、1ppmの不具合があると2048000個~2億個くらい不良がある計算になります。もちろん不良が出ない色々な仕組みがあるので大丈夫ですが。。。

単回帰分析の着せ替え

回帰分析の信頼区間と予測区間をピンク系(fuchsia)で可視化した下図に対して、可視化のベース色を変化させてみます。

f:id:OceanOne:20200816042236p:plain:w400

(aqua)

f:id:OceanOne:20200816042433p:plain:w400

(lime)

f:id:OceanOne:20200816042542p:plain:w400

(black)

f:id:OceanOne:20200816042626p:plain:w400

(blue)

f:id:OceanOne:20200816042732p:plain:w400

(orange)

f:id:OceanOne:20200816042806p:plain:w400

上記は、実線を()内のベース色にして、予測区間を幾分淡い色合いにした結果です。

まとめ

単回帰分析について着せ替えしてみました。色変えについては個人的には赤系(fuchsia)が見やすいように思うのですが如何でしょうか? これらも実装した結果を右記に置いています。こちらです。optionからGraph>Regression内のパラメータで変更できます。もっとこんな色合いが良いとかあれば是非お願いします。(何せ自分の参考になるので)