目次

クラスファイルを覗く

ソースファイル(.java)とクラスファイル(.class)の違い

ソースファイル(.java)とクラスファイル(.class)の違いをファイルの中を見ることで確認してみましょう。

Hello.java を例にします。ファイルがカレントディレクトリにあることを確認します。

$ ls -l [Enter]
.....
-rw------- 1 c1f08 c1f08 416 2009-02-12 19:21 Hello.class
-rw------- 1 c1f08 c1f08 119 2009-02-12 19:17 Hello.java
....

Hello.java

Hello.javaの内容を見てみます。

$ od -t x1z Hello.java [Enter]
0000000 70 75 62 6c 69 63 20 63 6c 61 73 73 20 48 65 6c  >public class Hel<
0000020 6c 6f 20 7b 20 0a 20 20 20 70 75 62 6c 69 63 20  >lo { .   public <
0000040 73 74 61 74 69 63 20 76 6f 69 64 20 6d 61 69 6e  >static void main<
0000060 28 20 53 74 72 69 6e 67 5b 5d 20 61 72 67 73 20  >( String[] args <
0000100 29 20 7b 0a 20 20 20 20 20 20 53 79 73 74 65 6d  >) {.      System<
0000120 2e 6f 75 74 2e 70 72 69 6e 74 6c 6e 28 22 48 65  >.out.println("He<
0000140 6c 6c 6f 20 57 6f 72 6c 64 21 22 29 3b 0a 20 20  >llo World!");.  <
0000160 20 7d 20 0a 7d 0a 0a                             > } .}..<
0000167

これでファイルのデータが16進表記で表すと次のように続いていることがわかります。

7075626c696320636c6173732048656c6c6f207b200a202020...

これを1バイトずつ1行に16バイト書き出しています。このような書き出しをダンプといいます。

最初の16バイトは、

70 75 62 6c 69 63 20 63 6c 61 73 73 20 48 65 6c

それを文字と解釈したものを右側に

>public class Hel<

と書いています。

70 が p, 75 が u, 62 が b, 6c が l, 69 が i, 63 が c, ....

です。20 はスペース、0a は改行です。

Hello.class

Hello.classの内容を見てみます。

$ od -t x1z Hello.class [Enter]
0000000 ca fe ba be 00 00 00 32 00 1d 0a 00 06 00 0f 09  >.......2........<
0000020 00 10 00 11 08 00 12 0a 00 13 00 14 07 00 15 07  >................<
0000040 00 16 01 00 06 3c 69 6e 69 74 3e 01 00 03 28 29  >.....<init>...()<
0000060 56 01 00 04 43 6f 64 65 01 00 0f 4c 69 6e 65 4e  >V...Code...LineN<
0000100 75 6d 62 65 72 54 61 62 6c 65 01 00 04 6d 61 69  >umberTable...mai<
0000120 6e 01 00 16 28 5b 4c 6a 61 76 61 2f 6c 61 6e 67  >n...([Ljava/lang<
0000140 2f 53 74 72 69 6e 67 3b 29 56 01 00 0a 53 6f 75  >/String;)V...Sou<
0000160 72 63 65 46 69 6c 65 01 00 0a 48 65 6c 6c 6f 2e  >rceFile...Hello.<
0000200 6a 61 76 61 0c 00 07 00 08 07 00 17 0c 00 18 00  >java............<
0000220 19 01 00 0c 48 65 6c 6c 6f 20 57 6f 72 6c 64 21  >....Hello World!<
0000240 07 00 1a 0c 00 1b 00 1c 01 00 05 48 65 6c 6c 6f  >...........Hello<
0000260 01 00 10 6a 61 76 61 2f 6c 61 6e 67 2f 4f 62 6a  >...java/lang/Obj<
0000300 65 63 74 01 00 10 6a 61 76 61 2f 6c 61 6e 67 2f  >ect...java/lang/<
0000320 53 79 73 74 65 6d 01 00 03 6f 75 74 01 00 15 4c  >System...out...L<
0000340 6a 61 76 61 2f 69 6f 2f 50 72 69 6e 74 53 74 72  >java/io/PrintStr<
0000360 65 61 6d 3b 01 00 13 6a 61 76 61 2f 69 6f 2f 50  >eam;...java/io/P<
0000400 72 69 6e 74 53 74 72 65 61 6d 01 00 07 70 72 69  >rintStream...pri<
0000420 6e 74 6c 6e 01 00 15 28 4c 6a 61 76 61 2f 6c 61  >ntln...(Ljava/la<
0000440 6e 67 2f 53 74 72 69 6e 67 3b 29 56 00 21 00 05  >ng/String;)V.!..<
0000460 00 06 00 00 00 00 00 02 00 01 00 07 00 08 00 01  >................<
0000500 00 09 00 00 00 1d 00 01 00 01 00 00 00 05 2a b7  >..............*.<
0000520 00 01 b1 00 00 00 01 00 0a 00 00 00 06 00 01 00  >................<
0000540 00 00 01 00 09 00 0b 00 0c 00 01 00 09 00 00 00  >................<
0000560 25 00 02 00 01 00 00 00 09 b2 00 02 12 03 b6 00  >%...............<
0000600 04 b1 00 00 00 01 00 0a 00 00 00 0a 00 02 00 00  >................<
0000620 00 03 00 08 00 04 00 01 00 0d 00 00 00 02 00 0e  >................<
0000640

ソースファイルと同様に文字として読める部分もありますが、文字として解釈できない部分も多くあります。

ca fe ba be 00 00 00 32 00 1d 0a 00 06 00 0f 09

最初の ca fe ba be はjavaのクラスファイルであることを識別するためのものです。

データ本体はその後の 00 00 00 32 00 1d 0a 00 06 00 0f 09 から始まりますが、対応する文字があるのは、32 の 2 だけで、その他は対応する文字がないので右側の部分にはすべてドットで表現されています。

32もたまたま文字にすれば 2 というだけで、2 の意味でここにあるわけではありません。このような文字としての解釈をしない前提で作られているファイルを一般にバイナリーファイルといいます。逆に文字としての解釈を前提にしたファイルをテキストファイルといいます。

以下に、英字だけのコード表(数値と文字の対応表)を出しておきます。

ASCIIコードの文字表

60+1=61 で 61に対応する文字は a 60+B=6B で 6Bに対応する文字は k と読みます。20は赤い色が付いていますが、これは半角スペースです。

薄い水色の部分は制御文字で、0a は改行、09 はタブ、07 はベルをならすことを意味します。普通の意味での文字ではありません。

ここにある文字以外を使う西洋諸国やアジアの文字、日本の文字を表すのにはそれぞれいくつかのやり方があります。さらに複雑になりますので解説はここまでにします。

ASCIIコードの文字表
  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F
00 NUL SOH STX ETX EOT ENQ ACK BEL BS HT LF VT FF CR SO SI
10 DLE DC1 DC2 DC3 DC4 NAK SYN ETB CAN EM SUB ESC FS GS RS US
20

.

! " # $ % & ' ( ) * + , - . /
30 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
40 @ A B C D E F G H I J K L M N O
50 P Q R S T U V W X Y Z [ \ ] ^ _
60 ` a b c d e f g h i j k l m n o
70 p q r s t u v w x y z { | } ~ DEL
もくじ

聖愛高等学校
http://www.seiai.ed.jp/
Last Modified