Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

正規分布

正規確率プロット縦軸表示方法

箱ひげ図と並んで、バラツキを含んだデータの代表的な可視化手法である正規確率プロットについて、縦軸表示の派生型を説明します。 正規確率プロット 正規確率プロットとはQ-Qプロット(quantile-quantile plot)の一種です。Q-Qプロットとは期待している確…

68–95–99.7則

68–95–99.7則というものがあるみたいです。 1,2,3sigma 統計学において68–95–99.7則とは、平均値を中心として両側1sigma、2sigma、3sigmaの幅に入るデータの割合です。より正確には、68.27%、95.45%、 99.73%で、正規分布の累積密度関数から計算されます。 …

工程能力

工程能力指数(process capability index)のCpとCpkです。 管理限界線と規格値 工程管理では一番わかりやすいのはスペック=規格値と思います。それぞれ上限(USL)と下限(LSL)があります。次に管理線として中心線、および上方管理限界線(UCL)と下方…

標準偏差(分散)をn-1で割る理由

標準偏差は下記のように平均偏差の二乗和をn-1で割り平方根とったものです。平方根の中はいわゆる不偏分散です。不偏分散算出時に何故n-1で割るかについては様々な統計ブログに記事が載っています。自身の勉強も兼ねて、なるべくわかりやすく説明してみたい…

共分散と相関係数

(そういえば書いていなかったので)相関係数について書きます。相関係数は共分散の改良版です。まずは共分散から入り、相関係数を説明します。 共分散から相関係数 (xi,yi)のデータ群があった時、共分散は下記のように定義されます。 ただし、xiとyiの平均…

乱数で中心極限定理

統計学で中心極限定理が説明していることは 期待値μ、分散σ2の任意の確率分布に従う母集団からの標本平均は、 nが十分大きい時には正規分布N(μ,σ2/n)で近似される です。つまり母集団に分散が定義できれば、どんな分布でも平均化していくと正規分布になる、…

正規確率プロット

箱ひげ図と並んで、バラツキを含んだデータの代表的な可視化手法である正規確率プロットと、その描き方について説明します。 ※説明を読むのが面倒くさい方は、こちら のツールで慣れてみてください。 Q-Qプロット Q-Qプロット(quantile-quantile plot)とは…

シグマ(標準偏差)が意味するもの

正規分布における標準偏差(シグマ)ってなんなのでしょうか? 正規分布のパラメータであるシグマについて。 正規分布と積分、微分 正規分布においては平均μと分散σ2(標準偏差σ)が分かれば任意のxの確率密度が次式で計算できます。 exp()の中を確認するとxに…

平均と分散の最尤推定

今回は正規分布から平均、分散の最尤推定について説明します。数式ばっかりですが、できる限り書き下していこうと思います。 正規分布 平均をμ、分散をσ2としたとき、正規分布において変数xの確率密度関数(ザックリいうとxの取りうる確率)は と表わされます…