【しーえすぶい】

CSV とは?

💡 データ交換の「共通語」、カンマで区切るシンプル形式
📌 このページのポイント
CSVファイルの構造 .csv テキストファイル UTF-8 / Shift-JIS 1行目: ヘッダー行 id,name,email,age データ行1: 1,田中太郎,tanaka@ex.jp,28 データ行2: 2,鈴木花子,suzuki@ex.jp,35 データ行3: 3,"佐藤,一郎",sato@ex.jp,42 注意: 値にカンマを含む場合 → ダブルクォートで囲む: "佐藤,一郎" 各行が1レコード、カンマが区切り、改行がレコード区切り
CSVファイル構造のイメージ
ひよこ ひよこ

CSVって中身はどうなってるの?

ペンギン先生 ペンギン先生

ただのテキストファイルで、1行が1レコード、各列をカンマで区切る。例えば「名前,年齢,職業」という1行目がヘッダーで、2行目以降が「田中,30,エンジニア」のようにデータが並ぶ。メモ帳でも開けるシンプルさが最大の強みだよ

ひよこ ひよこ

Excelとは何が違うの?

ペンギン先生 ペンギン先生

Excelファイル(.xlsx)はセルの書式設定、数式、グラフ、シートなど様々な情報を含むバイナリ形式。CSVは純粋なテキストでデータだけ。CSVExcelで開けるけど、書式やシート情報は保存されない。データのやり取りにはCSV、見た目の整ったレポートにはExcelと使い分けるんだよ

ひよこ ひよこ

文字化けすることがあるけど?

ペンギン先生 ペンギン先生

CSVあるある問題だね。原因は文字コードの違い。WindowsExcelはShift_JIS(CP932)を期待するけど、多くのシステムはUTF-8で出力する。対策は①UTF-8 BOM付きで出力する、②Excelの「テキストファイルウィザード」で文字コードを指定して開く。最近のExcelMicrosoft 365)はUTF-8CSVをそのまま開けるようになったよ

ひよこ ひよこ

データにカンマが含まれてたらどうなる?

ペンギン先生 ペンギン先生

いい質問だね。RFC 4180でルールが決まっていて、カンマやダブルクォートを含むフィールドはダブルクォートで囲む。「東京都, 千代田区」は「"東京都, 千代田区"」と書く。フィールド内にダブルクォートがあれば「""」とエスケープする。でも実際にはこのルールを守らないCSVも多くて、パースライブラリを使うのが安全だよ

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
CSV」って出てきたら「カンマ区切りのテキストデータ形式」と思えればだいたいOK!
📖 おまけ:英語の意味
「Comma Separated Values」 = カンマ区切り値
💬 Comma(カンマ)でValues(値)をSeparated(区切る)。最もシンプルなデータ形式だよ
← 用語集にもどる