【でーた】

データ とは?

💡 コンピューターが扱う「情報のかけら」すべて
📌 このページのポイント
データ → 情報 → 知識 のピラミッド データ(Data) 生の数値・文字列・記号の羅列 情報(Information) 整理・分析されて意味を持つ 知識 判断・行動に使える 例: 「冬はコート需要↑」 → 10月に在庫を増やす 例: 「12月の売上が多い」 例: 25, 38, 12, 45, 67... 加工 活用 データは「素材」、加工して初めて価値が生まれる
データのイメージ
ひよこ ひよこ

データって「情報」とは違うの?

ペンギン先生 ペンギン先生

いい質問だね。厳密にいうと違うんだ。「データ」は加工されていない生の事実。たとえば「37.5」という数字はデータ。これを「体温が37.5度だから微熱だ」と解釈したものが「情報」になる。つまりデータは素材で、情報はそれを意味づけしたものなんだよ。

ひよこ ひよこ

コンピューターの中ではデータってどうなってるの?

ペンギン先生 ペンギン先生

コンピューターの中では、すべてのデータは最終的に0と1の組み合わせ(バイナリ)で表現されている。文字も画像も音声も動画も、全部0と1の列なんだ。たとえば「A」という文字はASCIIコードで01000001。それを人間が読める形に変換して表示しているだけなんだよ。

ひよこ ひよこ

データにはどんな種類があるの?

ペンギン先生 ペンギン先生

大きく分けると「構造化データ」と「非構造化データ」がある。構造化データExcelの表みたいに行と列で整理されたもの。データベースに入れやすい。非構造化データは画像・動画・メール本文みたいに決まった形がないもの。実は世の中のデータの8割以上は非構造化データと言われていて、これをどう活用するかがAI時代の大きなテーマなんだ。

ひよこ ひよこ

データドリブン」ってよく聞くけど、それもデータに関係あるの?

ペンギン先生 ペンギン先生

そうそう。データドリブンは「勘や経験じゃなくデータに基づいて意思決定しよう」という考え方。ただこれ、言うのは簡単だけど実践は本当に難しい。データの収集方法にバイアスがあれば結論も歪むし、相関と因果を混同すると的外れな判断になる。「データがそう言ってるから正しい」と盲信するのは実は危険で、データの背景や集め方まで疑える目が大事なんだよね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「データ」って出てきたら「コンピューターが扱うあらゆる情報のことだな」と思えればだいたいOK!
📖 おまけ:英語の意味
「data」 = 与えられたもの・事実
💬 ラテン語のdatum(与えられたもの)の複数形。英語では本来複数形だけど、日本語では単数・複数を区別せず使うよ
← 用語集にもどる