Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

2020-01-01から1年間の記事一覧

正規確率プロットの傾き

正規確率プロットは、描画結果が直線であることで正規分布に従っていることを確認する可視化方法です。では、その直線の傾きは何を意味しているのでしょうか? ※説明を読むのが面倒くさい方は、こちら のツールで遊んでみてください。 正規確率プロットの傾…

実データと確率プロット

正規確率プロットを、実データについて適用した結果について述べたいと思います。 母集団が正規分布でない場合 正規確率プロットでは対象データの母集団は正規分布であること期待します。しかし実際は、(1)正規分布でない、(2)外れ値を含む、(3)い…

正規確率プロット

箱ひげ図と並んで、バラツキを含んだデータの代表的な可視化手法である正規確率プロットと、その描き方について説明します。 ※説明を読むのが面倒くさい方は、こちら のツールで慣れてみてください。 Q-Qプロット Q-Qプロット(quantile-quantile plot)とは…

シグマ(標準偏差)が意味するもの

正規分布における標準偏差(シグマ)ってなんなのでしょうか? 正規分布のパラメータであるシグマについて。 正規分布と積分、微分 正規分布においては平均μと分散σ2(標準偏差σ)が分かれば任意のxの確率密度が次式で計算できます。 exp()の中を確認するとxに…

平均と分散の最尤推定

今回は正規分布から平均、分散の最尤推定について説明します。数式ばっかりですが、できる限り書き下していこうと思います。 正規分布 平均をμ、分散をσ2としたとき、正規分布において変数xの確率密度関数(ザックリいうとxの取りうる確率)は と表わされます…

データの平均値、中央値

今回はデータの中心の値、正規分布なら平均値、より外れ値にロバストな中央値、その他派生型について説明します。 データ中心の代表値 あるバラツキのある特性値について代表値を知りたいときに用いられる、最も代表的な値は平均値と思います。ところが実際…

箱ひげ図(3)- サンプルサイズ

(今回は箱ひげ図(Box plot)をリアルデータに適用する場合のサンプルサイズについての注意点を説明します。 サンプルサイズ(Sample size) Box plotの弱点の一つはサンプルサイズがわかりにくい点です。下図はとあるデータでBox plotを統計ソフトRで描画さ…

箱ひげ図(2)

箱ひげ図(1)ではBox plotの基礎を述べました。実際にはさらに改良が加えられたツールを用いることが多く、ソフトによってもいろいろな派生形があります。今回は基本形に追加される代表的な可視化方法を説明します。 外れ値(Outlier) リアルデータを扱って…

箱ひげ図(1)

箱ひげ図(Box plot)について説明します。我々製品エンジニアは様々な条件で試作し、優劣を比較します。Box plotは多くの条件間比較を行う場合に便利です。直感的な可視化方法ですが、本当に理解しようとすると統計知識が不可欠です。 Box plotは和名の通り…

自己紹介

OceanOneと申します。しがないエンジニアをやっています。自分のノウハウを書き下してみようと思いブログを開設してみました。 少し偏っているかも知れませんが、専門知識に加えてエンジニアは下記の3つの言語が知識として必要だと思っています。 1.(共…