【もじばけ】

文字化け(もじばけ) とは?

💡 文字コードのすれ違いが起こす「読めない暗号」
📌 このページのポイント
文字化けが起きる仕組み 送信側 UTF-8 こんにちは 送信 ネットワーク E3 81 93 E3 82 93 E3 81 AB ... 受信 受信側 Shift_JIS 繧コ繧ォ繝√ヶ エンコーディング不一致! 正しい場合(同じ文字コードを使う) 送信 UTF-8 こんにちは 受信 UTF-8 送信側と受信側で文字コードが異なると、文字が正しく表示されない。
文字化けのイメージ
ひよこ ひよこ

メールを開いたら「笊コ蛹コ」みたいな変な文字だらけだったんだけど…

ペンギン先生 ペンギン先生

それは文字化けだね。テキストデータには「この文字コードで読んでね」という情報がついているんだけど、受け取る側が違う文字コードで読もうとすると意味不明な文字になっちゃうんだ。

ひよこ ひよこ

文字コードってそんなにたくさんあるの?

ペンギン先生 ペンギン先生

日本語だけでもShift_JIS、EUC-JP、ISO-2022-JP、UTF-8と色々あるんだよ。昔はWindowsがShift_JIS、LinuxがEUC-JPを使うことが多くて、データをやり取りするたびに文字化けが起きていたんだ。

ひよこ ひよこ

じゃあ文字化けしたらどうすればいいの?

ペンギン先生 ペンギン先生

テキストエディタやブラウザで文字コードを手動で切り替えてみるといいよ。正しい文字コードに合わせれば、ちゃんと読めるようになる。最近のブラウザは自動判定してくれることも多いけどね。

ひよこ ひよこ

文字化けをなくすにはどうしたらいい?

ペンギン先生 ペンギン先生

世界中でUTF-8を使おうという流れになっていて、最近はかなり文字化けが減ったんだ。新しくファイルやWebサイトを作るときはUTF-8を使うのが鉄則だよ。それでも古いシステムとやり取りするときは注意が必要だね。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
「文字化け」って出てきたら「文字コードの不一致で文字が正しく表示されない現象」と思えればだいたいOK!
📖 おまけ:英語の意味
「文字化け」 = 文字がお化けのように変わる
💬 日本語は文字コードの種類が多かったため、英語圏より文字化けに悩まされてきた歴史があるんだ。英語の「mojibake」として国際的にも通じる日本語由来の技術用語なんだよ
← 用語集にもどる