Engineering Skills

製品開発エンジニアがデータ解析のノウハウを垂れ流します

Quadrant chart

2次元の散布図を4色に色分けするQuadrant chart(クアドラントチャート、4象限グラフ)を紹介します。個人的にはあまり使う機会はないですが、散布図を用いて砕けた説明をする場合にはわかりやすさという点で一定の効果があるのではないかと思います。

クアドラントチャート

2次元散布図を4つの領域に分けます。例えばこのような感じです。

f:id:OceanOne:20200923235518p:plain:w300

この例では左上(黄色領域)に外れ値を持っていて、説明(プレゼン)する場合にちょっとだけ便利です。

クアドラントチャートは、ある意味非常に原始的なクラスタリングのような働きを持っていると思います。そしてクラスタリングの知識が全くない聴衆にもわかりやすく伝えられることができます。

また、プアな2次元グラフも背景に4色置くだけで装飾も可能です。。。

クアドラントとは

そもそもクアドラントとは、象限(orthant)の一種で2次元の場合は平面を4領域に分ける四分儀(quadrant)のことです。3次元なら八分儀です。

余談ですが懐かしい第一象限~第四象限は指し示せますか? 各象限の対応は下記のようになります。

f:id:OceanOne:20200924005506p:plain:w300

半時計周りです。

f:id:OceanOne:20200924005742p:plain:w300

英語では下記のように呼びます。

f:id:OceanOne:20200924005823p:plain:w300

中心値の置き方

理論的根拠がないのでなんでもありだと思います。例えば横軸/縦軸を等分する方法

f:id:OceanOne:20200924001827p:plain:w300

横軸/縦軸それぞれの平均値を中心値とする方法

f:id:OceanOne:20200924002014p:plain:w300

応用で横軸/縦軸それぞれの中央値を中心値としても良いかも知れません。

f:id:OceanOne:20200924002111p:plain:w300

上記データセットでは、外れ値を含んでいるので中央値を中心値とすると回帰直線とも交わるように4領域に分けられます。

カラーヴァリエーション

中心線だけで分ける場合もありますが、4色で分けると例えば下記。

f:id:OceanOne:20200924002833p:plain:w300 f:id:OceanOne:20200924002855p:plain:w300 f:id:OceanOne:20200924002918p:plain:w300

思い切って2色で分割する方が、スッキリしているようにも思います。

f:id:OceanOne:20200924002935p:plain:w300 f:id:OceanOne:20200924002950p:plain:w300 f:id:OceanOne:20200924003006p:plain:w300

まとめ

クアドラントチャートを紹介しました。今回紹介したグラフは、例によってこちらのツールに実装して描画したものです。こんな配色にすべき/こんな配色が素敵というのがあれば作ってみますのでリクエストしてみてください。