1バイトコード表

ASCIIコード

American Standard Code for Information Interchange 正確には7ビットで文字を表現する7ビットコードで、残りの1ビットはチェックのために使っていた。7ビットコードは8ビットの最初のビットが0であると考えると8ビットコードの半分と考えることができる。

0x00から0x7fまでの128のコードがあるが、このうち0x00から0x1fまでは制御コードで改行や紙送り、バックスペース(一文字削除)、ベルを鳴らす、拡張文字の開始など機器を制御する信号に割り当てられている。

実際の文字は0x20から0x7eまでの95文字で、記号、数字、英字(大文字と小文字)からなっている。0x7fは歴史的理由により削除の制御コードである。

現在ウェブページの記述などで私たちが目にするのは8ビットコードのISO-8859-1なのだが日本では区別せずにASCIIといってしまうことが多い。

US-ASCIIコード表

41 が A, 6D が m と読む。

1桁目→
↓2桁目
01 23 45 67
0NUL DLE SP0@P`p
1SOH DC1 !1AQaq
2STX DC2 "2BRbr
3ETX DC3 #3CScs
4EOT DC4 $4DTdt
5ENQ NAK %5EUeu
6ACK SYN &6FVfv
7BEL ETB '7GWgw
8BS CAN (8HXhx
9HT EM) 9IYiy
ALF SUB *:JZj z
BVT ESC +;K[k{
CFF FS, <L\l|
DCR GS -=M]m}
ESO RS .>N^n~
FSI US /?O_o DEL

ISO/IEC 646

ISO(国際標準化機構)とIEC(国際電気標準会議)が策定した7ビットコード。JISが基づいているのはこちらなのだが、ASCIIの知名度が高くこちらは知られていない。

USAではASCIIのアルファベットで全部の文字が表現できるが、フランス語のアクサンやセデーユのついた文字、ドイツ語のウムラウトのついた文字やエスツェット、さらに各国の通貨記号などこれだけでは不足である。ISO/IEC 646 では、0x23, 0x24, 0x5b~0x5e, 0x67b~0x7e は各国それぞれに必要な文字と入れ替えることができると決められている。日本では0x5cを¥に、0x7fを¯に割り当ててJIS規格としている。

なお、その国際基準版はASCIIと完全一致するよう1991年に変更された。

JIS X 0201

ISO/IEC 646 に基づき ¥ と ¯ を変更し、半角カナを加えたものです。ここには8ビットコードを書きましたが、7ビットで切り替えて使うものも定義されています。e列f列の「未」は未定義の部分です。8列9列は7ビットでは0列1列の制御コードと重なるので空けています。

濁点、半濁点は別になっていますので「ガ」は「カ」「゛」と2バイトで表現されます。

0123 4567 89ab cdef
0 0 @P`p  
1!1 AQaq
2"2 BRbr
3#3 CScs
4$4 DTdt
5%5 EUeu
6&6 FVfv
7'7 GWgw
8(8 HXhx
9)9 IYiy
a*: JZjz
b+; K[k{
c,< L¥ l|
d-= M]m}
e.> N^n¯
f/? O_odel ソ

ISO/IEC 8859

ISOとIECが合同で定めた、8ビット文字コードの標準。8ビットにした分、いろいろな文字を追加することができる。0x80から0x9fの間も制御コードとして文字を配置していない。

結局8ビットにしても各国の文字をすべて入れるのには足りず、いくつかのパートに分けられた。混合して使用する言語の組み合わせを考えて決めており複数ののパートに登録されている文字もある。

英語、ドイツ語、イタリア語など日本人がよく目にする文字はISO-8859-1かその改訂版のISO-8859-15を使うことで網羅される。

ISO-8859-1

やはり、41がA, 6Dがmと読む。左半分はASCIIと同じ。

0123456789abcdef
0 0@P`p °ÀÐàð
1!1AQaq¡±ÁÑáñ
2"2BRbr¢²ÂÒâò
3#3CScs£³ÃÓãó
4$4DTdt¤´ÄÔäô
5%5EUeu¥µÅÕåõ
6&6FVfv¦ÆÖæö
7'7GWgw§·Ç×ç÷
8(8HXhx¨¸ÈØèø
9)9IYiy©¹ÉÙéù
a*:JZjzªºÊÚêú
b+;K[k{«»ËÛëû
c,<L\l|¬¼ÌÜìü
d-=M]m}­½ÍÝíý
e.>N^n~®¾ÎÞîþ
f/?O_odel¯¿Ïßïÿ

当然ながら1バイトで表現できない漢字をもつ中国、日本などの文字は規格になっていない。

しかし、1バイトで表現できる文字に限っても1バイトで全部を網羅できずにパートの切りかえの仕組みが必要になる。

複数バイトを使い世界中の文字を切りかえ無しで表現するunicodeの策定が始まり、ISO/IEC 8859 の作業はここでとまっている。

ただunicodeを必要としない西洋のウェブページでは文字コードを指定する時にはasciiではなく、ISO-8859-1かその改訂版のISO-8859-15を使っている事が多い。

ISO-8859-1とISO-8859-15の違い

大したことではない。一番大きいのはユーロの通貨記号だろう。

ISO-8859-1

ISO-8859-15

ISO

国際標準化機構(こくさいひょうじゅんかきこう、International Organization for Standardization)、または略称 ISO(アイソ、アイエスオー、イソ)は、電気分野を除く工業分野の国際的な標準である国際規格を策定するための民間の非政府組織。本部はスイスのジュネーヴ。スイス民法による非営利法人。公用語はフランス語、英語、ロシア語。各国1機関が参加できる。(出典: フリー百科事典『ウィキペディア(Wikipedia)』)

英語:International Organization For Standardization

仏語:L'Organisation internationale de normalisation (OIN)

露語:Международная организация по стандартизации

国際標準化機構という名称を略称で表そうとしたとき、言語によって異なる略称になってしまう(英語ではIOS、フランス語ではOINなど)。そこでギリシア語のisos(均等、均質)にちなみ、言語や地域によらない短縮名としてISOが選ばれた。

IEC

国際電気標準会議(こくさいでんきひょうじゅんかいぎ、International Electrotechnical Commission、IEC)

電気工学、電子工学、および関連した技術を扱う国際的な標準化団体


聖愛中学高等学校
http://www.seiai.ed.jp/
Last Modified