文字符号化方法の指定

文字符号化方法とは

HTML文書がどの文字符号化方法(文字エンコーディング俗に文字コードという)で書かれているかを指定します。Windows上のソフトならばShift_JISが使われていますが、他のコンピュータでもそうだとは限りません。

XHTMLの場合はXMLの宣言で文字符号化方法を書きますので本来は不要ですが、XML宣言を理解しないブラウザのためにHTMLと同様な方法で指定する必要な場合があります。

こうしよう

Shift_JISの場合は次のように書くとよいでしょう。書く場所は<HEAD>と</HEAD>の間ですが、<TITLE>に日本語を使用している場合はその前にしなければ、TITLEを読む時にこまります。<HEAD>の直後がいいでしょう。

<html>
<head>
<META http-equiv="Content-Type" content="text/html; charset=Shift_JIS">
………

ダブルクォーテーションの位置に注意します。charset="Shift_JIS"ではありません。この指定では、 Content-Type が text/html であり、 charset=Shift_JIS でもある という意味なのです。

もちろん実際に使用している文字コードと合わせなければなりません。K2Editorでは右下の部分に常に表示されています。

SJISはShift_JISのこと

3つの種類

HTMLで使用される日本語の文字符号化方法は3種類です。Shift_JIS はシフトJIS、euc-jp は EUC、iso-2022-jp はJISコードです。

iso-2022-jp日本語。メールに使用されるので有名
Shift_JIS日本語。windowsで使用
EUC-JP日本語。UNIX系のOSで使用
iso-8859-1欧文。 ASCII 文字セット。
iso-8859-2欧文のもうひとつのタイプ

もしもEUC-JPのときは、次のように指定します。

<META http-equiv="Content-Type" content="text/html; charset=EUC-JP">

正しく指定されない場合

間違った指定をすると、いわゆる文字化けの状態になります。たとえば、Shift_JISで書かれたものをEUC-JPで表示すると、

Shift_JISをeucで表示

Shift_JISで書かれたものをiso-8859-1で表示すると、

Shift_JISを8859-1で表示

EUC-JPで書かれたものをShift_JISで表示すると

EUCをShift_JISで表示

いままで指定しなくても正しく表示されていましたが、いつでもうまくいくとは限りません。校内限定に設定したサーバーと、閲覧する側も指定がなければShift_JISにするという設定になっていたブラウザの条件でうまくいっていたのです。インターネットに公開する時は、きちんと設定した方がいいでしょう。

化けた時は

逆に他の人が作っているページが化けていた時には次のようにして直る場合があります。表示−コードのメニューからEUC-JPやShift_JISを選びます。(普段は自動判別にしておきましょう)

FireFoxの場合

SJISはShift_JISのこと

IEの場合

SJISはShift_JISのこと

聖愛高等学校
http://www.seiai.ed.jp/