【さんぷず】

散布図 とは?

💡 データの「仲良し度」を点々で見える化する図
📌 このページのポイント
散布図 ― 2つのデータの関係を見る 正の相関 負の相関 無相関 片方↑ → もう片方も↑ 片方↑ → もう片方↓ 関係なし 点の散らばり方で2つのデータの関係がわかる
散布図の3パターンのイメージ
ひよこ ひよこ

散布図って、どういうグラフなの?

ペンギン先生 ペンギン先生

2つのデータの関係を見るために、点をポンポンと打っていくグラフだよ。たとえば「勉強時間」と「テストの点数」みたいに、2つの数字の組み合わせを1つの点として表すんだ

ひよこ ひよこ

点を打つと何がわかるの?

ペンギン先生 ペンギン先生

点が右肩上がりに並んでいたら「片方が増えるともう片方も増える」って関係(正の相関)がわかるし、右肩下がりなら逆の関係(負の相関)がわかるよ。バラバラなら関係なしだね

ひよこ ひよこ

ソフトウェア開発でも使うの?

ペンギン先生 ペンギン先生

もちろん!たとえば「コードの行数」と「バグの数」の関係を散布図にすると、コードが多いモジュールほどバグが多いかどうかが一目でわかるよ

ひよこ ひよこ

相関があるからって、原因と結果ってわけじゃないよね?

ペンギン先生 ペンギン先生

いい質問だね!「相関関係は因果関係ではない」というのはデータ分析の基本中の基本だよ。散布図で関係が見えたら、次にその理由を深掘りすることが大事なんだ

ひよこ ひよこ

散布図を使うときのコツってある?

ペンギン先生 ペンギン先生

データの数が少なすぎると信頼性が低くなるから、ある程度まとまったデータで描くのがコツだよ。あと外れ値を見つけたら「なぜ外れているのか」を調べると新しい発見につながることが多いね

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「散布図」って出てきたら「2つのデータの関係を点で見える化するグラフ」と思えればだいたいOK!
📖 おまけ:英語の意味
「Scatter Diagram」 = 散布図
💬 scatter は「ばらまく」という意味で、データの点をばらまいたように見えることからこの名前がついたんだよ
← 用語集にもどる