【あすきー】

ASCII とは?

💡 英数字と記号を「7ビットで表現」する文字コードの原点
📌 このページのポイント
ASCII文字コード表(抜粋) コード 文字 コード 文字 48 0 49 1 65 A 66 B 97 a 98 b 32 (空白) 33 ! 0〜127 の数字で英数字・記号を表す(全128文字) 大文字A=65、小文字a=97(差は32)
ASCIIのイメージ
ひよこ ひよこ

ASCIIって何?

ペンギン先生 ペンギン先生

英数字と記号を0〜127の番号で表す文字コードの元祖だよ。「A」は65・「a」は97・「0」は48という対応が決まっている。コンピュータが文字を数字として扱うための最初の標準規格。

ひよこ ひよこ

127文字しかないの?

ペンギン先生 ペンギン先生

そう。7ビットで表現できる最大が128種類(0〜127)。英数字・記号・改行などの制御文字でちょうど収まる。日本語・中国語などは表現できないから、各国が独自の拡張コードを作った(Shift-JISなど)。これがUnicodeへの移行の背景。

ひよこ ひよこ

プログラミングでASCIIコードを使う場面は?

ペンギン先生 ペンギン先生

文字を数値として処理するとき。「'A'.charCodeAt(0) == 65」(JavaScript)・「ord('A') == 65」(Python)のように文字と数値の変換ができる。暗号・エンコード・バイナリ処理などでASCIIコードの知識が役立つ。

ひよこ ひよこ

日本語はASCIIで表せないの?どうするの?

ペンギン先生 ペンギン先生

ASCIIは英語圏の文字しかカバーしていないから、日本語は表せないんだ。歴史的にはShift_JIS、EUC-JPといった日本語専用のエンコーディングが使われてきたけど、今はUTF-8がほぼ世界標準だよ。UTF-8はASCIIの上位互換で、英語の文字はASCIIと同じバイト列、日本語は3バイトで表現する。実はASCIIの最初の32文字(0〜31)は「制御文字」で、改行やタブのように目に見えない操作を表すんだ。Ctrl+Cで処理を止められるのもASCIIの制御文字(ETX: End of Text)が由来だよ。

ペンギン
まとめ:ざっくりこれだけ覚えればOK!
ASCIIって出てきたら「英数字・記号を0〜127の番号で表す文字コードの原点、UTF-8と後方互換」と思えばOK!
📖 おまけ:英語の意味
「American Standard Code for Information Interchange」 = アメリカ標準情報交換コード
💬 1963年にANSIが標準化。英語圏のコンピュータが文字を共通の番号で扱うための規格で、現代のすべての文字コードの基盤となっている
← 用語集にもどる