コンピュータにおいてテキストデータを扱う上で欠かせない文字コード。文字と符号(ビット組み合わせ)で形作られる文字コードの基本的な性質はシンプルです。しかし、文字コード、とりわけ日本語情報処理となると、数々の落とし穴が潜む、ときに専門的な知識が求められる、そのような難易度の高いイメージが漂うのはなぜでしょうか。その背景を探ると、文字コードとは切っても切り離せない「文字という存在、そのものの難しさ」「規格を含む過去の経緯の積み重ね」の影響が浮かび上がってきます。本書では、文字そのものと、文字コードの歴史を少しずつ解きほぐしながら、文字コードの原則、変遷、おもな規格の要点をはじめとした基礎知識を丁寧に解説。さらに、Unicode、日本の文字コード規格、文字化けのメカニズム、コード変換の基礎、Java、Rubyでの扱い、はまりやすい落とし穴とその対処なども平易に取り上げます。今回の改訂では執筆時点最新版のUnicode 11.0、各種ソフトウェア環境に対応し、合わせてJIS X 0213:2012改正や常用漢字表の2010年改正に関する補足等も追加。広くソフトウェアエンジニアの方々、プログラマの方々へ、文字コードの原理原則という長く役立つ基礎と、最新の仕様を反映とした、今知っておきたい技術情報を厳選してお届けします。