Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

2020-05-01から1ヶ月間の記事一覧

ノンパラメトリック手法の対応表

様々な統計分析手法には、主に正規分布を仮定したパラメトリックな手法と順序統計量に基づく特定の分布を仮定しないノンパラメトリックな手法が存在します。二つの対応関係は平均値と中央値のようなものです。正規分布を仮定でき外れ値などもなければ平均値…

箱ひげ図(4)ー オプション

条件間比較をする場合に有用な箱ひげ図(Box plot)ですが、表示方法にいくつかオプションがあります。今回は派生型を紹介します。以下に示す箱ひげ図は、みんな大好きアヤメ(iris)データのがく片の長さ(sepal length)を用いています。表示結果は自身で…

ロバストZスコア

データ集合が与えらえた時、平均0と標準偏差1になるようデータを標準化することを正規化と呼び、変換された数値をZスコアと呼びます。Zスコアを10倍し50足した数値は、おなじみの偏差値になります。 通常は平均と標準偏差を用いた変換が行われますが、平均や…

正規性検定

データ解析を始めるにあたって、データ集合が正規分布に従っている(正規分布で近似できる)かどうかを確認することは重要な第一歩です。統計検定において正規分布であるかどうかの検定があります。実は種類がたくさんあり、算出方法も色々です。今回は勉強…