Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

2020-02-01から1ヶ月間の記事一覧

確証バイアス

確証バイアスは認知バイアスの一種です。自説を支持する情報ばかりを集め、反証する情報を無視または集めようとしない傾向のことです。 実験に従事する方々は、Wikpedia確証バイアスの"科学"に書かれている事柄は常に心に留め置くべきです。年齢が上がるにつ…

トライアンギュレーション(データの三角測量)

社会科学の分野において、トライアンギュレーション(triangulation)という言葉があります。日本語訳は、「三角測量」です。測量方法を表す言葉ですが、データソースや検証方法を複数化(複眼化)し、研究の妥当性を高める方法として考案されました。客観性を…

Fisherの3原則

DOE

実験を効率的に行うための理論として実験計画法があります。ここで言う「良い実験」とは、少ない試行数で、より多くの事実が、出来るだけ精度高く、わかるような実験です。そのために効率的な実験を計画し、最適な解析手法をセットで適用することを考えます…

正規確率プロットの傾き

正規確率プロットは、描画結果が直線であることで正規分布に従っていることを確認する可視化方法です。では、その直線の傾きは何を意味しているのでしょうか? ※説明を読むのが面倒くさい方は、こちら のツールで遊んでみてください。 正規確率プロットの傾…

実データと確率プロット

正規確率プロットを、実データについて適用した結果について述べたいと思います。 母集団が正規分布でない場合 正規確率プロットでは対象データの母集団は正規分布であること期待します。しかし実際は、(1)正規分布でない、(2)外れ値を含む、(3)い…

正規確率プロット

箱ひげ図と並んで、バラツキを含んだデータの代表的な可視化手法である正規確率プロットと、その描き方について説明します。 ※説明を読むのが面倒くさい方は、こちら のツールで慣れてみてください。 Q-Qプロット Q-Qプロット(quantile-quantile plot)とは…

シグマ(標準偏差)が意味するもの

正規分布における標準偏差(シグマ)ってなんなのでしょうか? 正規分布のパラメータであるシグマについて。 正規分布と積分、微分 正規分布においては平均μと分散σ2(標準偏差σ)が分かれば任意のxの確率密度が次式で計算できます。 exp()の中を確認するとxに…