ハードウェア・ソフトウェア
文字コード
Character Encoding
概要
文字をコンピュータ上で扱うために、各文字に一意の番号を割り当てた体系。
詳細解説
文字コードは、文字と数値の対応関係を定めた規格である。ASCIIは英数字を7ビットで表現する基本的な文字コードで、128種類の文字を扱える。日本語にはJISコード、シフトJIS、EUC-JPなどの文字コードがある。
Unicodeは世界中の文字を統一的に扱うための国際規格で、UTF-8はその代表的な符号化方式である。UTF-8はASCIIと互換性があり、Webの標準文字コードとして普及している。
事例・具体例
HTMLファイルの文字化けは、作成時と表示時の文字コードが異なることが原因で発生する。UTF-8の普及により文字化け問題は減少傾向にある。