「文字コード」の種類

水曜日 , 5, 9月 2018 Leave a comment

ひとくちに、Webページで使用される文字コードといっても、たくさんの種類があります。そして、言語によって、形式も使用できる文字コードも違ってきます。
日本語の文字コードとしては、「シフトJIS (SJIS)」「EUC-JP」「JIS(ISO-2022-JP)」「UTF-8」があります。
その中で、Webアプリケーションの文字コードとして、主に使用されるものは「シフトJ1S」「EUC-JP」「UTF-8」です。

まず、「シフトJIS」は、Windows や携帯端末でよく使われている文字コードです。携帯端末で閲覧するWebアプリケーションでは、古い機種でも表示できるように「シフトJIS」を採用しているサイトもあります。
一方「EUC-JP」は、Linux を含めた Unix 系のオベレーテインクシステムにおいて広く使われてきました。そのため、大手検索エンジンサイトなどにも、「EUC-JP」を採用しているものがあります。
また、「UTF-8」は、多言語に対応している「Unicode(ユニコード)」と呼ばれる文字コードのひとつで、日本語以外の言語でも使用されています。

Unicodeは文字コードと言語の依存関係がなく、日本語、中国語や英語などの複数の言語を混在して使用できるのが大きな特徴です。
例えば、ひとつのサイトで世界の言語に対応させなければならない場合などに、文字コードを「UTF-8」で統一します。
このように、文字化けを防ぐためには、Webアプリケーションで使用する文字コードを統一すると良いでしょう。

Please give us your valuable comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です