1. 字节码

Java字节码是Java虚拟机执行的一种指令格式.class文件是编译器编译之后供虚拟机解释执行的二进制字节码文件.

下面举个例子,写一段Java打码,并编译.

package com.xfhy.test;

public class Hello {

private int num = 1;

public int add() {

num = num + 2;

return num;

}

}

编译得到class文件之后,用Hex Fiend软件打开该class文件.

CAFEBABE 00000034 00130A00 04000F09 00030010 07001107 00120100 036E756D

01000149 0100063C 696E6974 3E010003 28295601 0004436F 64650100 0F4C696E

654E756D 62657254 61626C65 01000361 64640100 03282949 01000A53 6F757263

6546696C 6501000A 48656C6C 6F2E6A61 76610C00 0700080C 00050006 01001363

6F6D2F78 6668792F 74657374 2F48656C 6C6F0100 106A6176 612F6C61 6E672F4F

626A6563 74002100 03000400 00000100 02000500 06000000 02000100 07000800

01000900 00002600 02000100 00000A2A B700012A 04B50002 B1000000 01000A00

00000A00 02000000 03000400 04000100 0B000C00 01000900 00002B00 03000100

00000F2A 2AB40002 0560B500 022AB400 02AC0000 0001000A 0000000A 00020000

0007000A 00080001 000D0000 0002000E

class文件内部就是长这个样子. 里面是一堆16进制字节,完全看不懂.JVM是如何解读的?

2. 字节码结构

class文件格式采用一种类似于C语言结构体的伪结构来存储数据,这种伪结构只有两种数据类型: 无符号数和表.无符号数: 无符号数可以用来描述数字、索引引用、数量值或按照utf-8编码构成的字符串值.其中无符号数属于基本的数据类型。 以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节和8个字节.

表: 表是由多个无符号数或其他表构成的复合数据结构.所有的表都以“_info”结尾, 由于表没有固定长度,所以通常会在其前面加上个数说明.

class的内容其实就是下面这张表里面的数据顺序排列的,只需要安装这个顺序逐一进行解读就可以了:

2.1 魔数

用于标记当前文件是class(为啥不是用后缀来标记该文件为class文件,因为防止后缀被修改,为了安全),固定值为0XCAFEBABE.文件一开始就是这个.

2.2 版本号

魔数后面的00000034是版本号,也是4个字节,其中前2个字节表示副版本号,后2个字节表示主版本号.这里0034对应的值是52,也就是jdk 1.8.0

2.3 常量池

2.3.1 常量池容量计数器

接着是常量池相关的东西了,常量池的数量不固定,需要2个字节来表示常量池容量计数值.demo里面是0013,也就是19.

咱通过javap -verbose Hello命令查看该class的字节码如下(只截取了常量池部分数据):

Constant pool:

#1 = Methodref #4.#15 // java/lang/Object."":()V

#2 = Fieldref #3.#16 // com/xfhy/test/Hello.num:I

#3 = Class #17 // com/xfhy/test/Hello

#4 = Class #18 // java/lang/Object

#5 = Utf8 num

#6 = Utf8 I

#7 = Utf8

#8 = Utf8 ()V

#9 = Utf8 Code

#10 = Utf8 LineNumberTable

#11 = Utf8 add

#12 = Utf8 ()I

#13 = Utf8 SourceFile

#14 = Utf8 Hello.java

#15 = NameAndType #7:#8 // "":()V

#16 = NameAndType #5:#6 // num:I

#17 = Utf8 com/xfhy/test/Hello

#18 = Utf8 java/lang/Object

可以看到这里其实序号是从1开始的,而且总共是18个??? 那为啥class文件里面的数值是19?因为它把第0项常量空出来了:这是为了在于满足后面某些指向常量池的索引值的数据在特定情况下需要表达"不引用任何一个常量池项目"的含义,这种情况可用索引值0来表示.

2.3.2 常量解读

首先是第一个常量0x0a,即10.这里的10代表的是CONSTANT_Methodref_info,即类中方法的符号引用. 常量标志数值的含义表:

什么是符号引用? 常量池主要存放两大常量,字面量和符号引用.字面量: 文本字符串,声明为final的常量值

符号引用: 类和接口的全限定名,字段的名称和描述符,方法的名称和描述符

知道了该标志的含义,说明接下来的数据就是类中方法的符号引用的数据.但是我们不知道这个数据到底有多长.得看下面这个表格,常量池中的17种数据类型的结构总表,才知道它的结构到底如何:

从表中查出CONSTANT_Methodref_info的tag是10,上面已经拿到了.然后接下来的2个u2表示它的数据,在demo中的值为: 0004 000F前两位的值为0x0004,即 4,指向常量池第 4 项的索引

后两位的值为0x000f,即 15,指向常量池第 15 项的索引

至此,第一个常量就解读完毕了.后面还有17个常量,就不一一解读了,就是查字典.所有的常量都在这里了,它们最后的解读出来是和javap -verbose Hello解读出来的Constant pool是一致的.

0A00 04000F09 00030010 07001107 00120100 036E756D

01000149 0100063C 696E6974 3E010003 28295601 0004436F 64650100 0F4C696E

654E756D 62657254 61626C65 01000361 64640100 03282949 01000A53 6F757263

6546696C 6501000A 48656C6C 6F2E6A61 76610C00 0700080C 00050006 01001363

6F6D2F78 6668792F 74657374 2F48656C 6C6F0100 106A6176 612F6C61 6E672F4F

626A6563 74

2.4 访问标志

常量池过了就是访问标志了,用两个字节来表示,其标识了类或者接口的访问信息,比如:该 Class 文件是类还是接口,是否被定义成public,是否是abstract,如果是类,是否被声明成final等等。各种访问标志如下所示:

在本demo中是0021,为了方便寻找,我加了~~将该位置数据间隔开.

CAFEBABE 00000034 00130A00 04000F09 00030010 07001107 00120100 036E756D

01000149 0100063C 696E6974 3E010003 28295601 0004436F 64650100 0F4C696E

654E756D 62657254 61626C65 01000361 64640100 03282949 01000A53 6F757263

6546696C 6501000A 48656C6C 6F2E6A61 76610C00 0700080C 00050006 01001363

6F6D2F78 6668792F 74657374 2F48656C 6C6F0100 106A6176 612F6C61 6E672F4F

626A6563 74~~0021~~00 03000400 00000100 02000500 06000000 02000100 07000800

01000900 00002600 02000100 00000A2A B700012A 04B50002 B1000000 01000A00

00000A00 02000000 03000400 04000100 0B000C00 01000900 00002B00 03000100

00000F2A 2AB40002 0560B500 022AB400 02AC0000 0001000A 0000000A 00020000

0007000A 00080001 000D0000 0002000E

0x0021就是0x0001和0x0020的并集,即就是public.

2.5 类索引,父类索引,接口索引访问标志后的两个字节就是类索引

类索引后的两个字节就是父类索引

父类索引后的两个字节则是接口索引计数器

我将数据标记了一下:

CAFEBABE 00000034 00130A00 04000F09 00030010 07001107 00120100 036E756D

01000149 0100063C 696E6974 3E010003 28295601 0004436F 64650100 0F4C696E

654E756D 62657254 61626C65 01000361 64640100 03282949 01000A53 6F757263

6546696C 6501000A 48656C6C 6F2E6A61 76610C00 0700080C 00050006 01001363

6F6D2F78 6668792F 74657374 2F48656C 6C6F0100 106A6176 612F6C61 6E672F4F

626A6563 740021~~00 03000400 00~~000100 02000500 06000000 02000100 07000800

01000900 00002600 02000100 00000A2A B700012A 04B50002 B1000000 01000A00

00000A00 02000000 03000400 04000100 0B000C00 01000900 00002B00 03000100

00000F2A 2AB40002 0560B500 022AB400 02AC0000 0001000A 0000000A 00020000

0007000A 00080001 000D0000 0002000E

2.5.1 类索引

类索引的值为0x0003, 即为指向常量池中第三项的索引com/xfhy/test/Hello,这里用到了常量池,通过类索引可以确定类的全限定名.

2.5.2 父类索引

父类索引的值为0x0004,即为指向常量池中第4项的索引java/lang/Object,类都是继承自Object的.

2.5.3 接口计数器

然后是接口计数器0x0000,这里没有接口,所以是0.

2.5.4 接口索引集合

这里本来接下来是接口索引集合的,但是这里没有用,所以不占数据空间.

2.6 字段表

字段表用来描述类或者接口中声明的变量.这里的字段包含了类级别变量以及实例变量,但是不包括方法内部声明的局部变量.

字段表里面包含了以下几个数据:

我将数据标记了一下:

CAFEBABE 00000034 00130A00 04000F09 00030010 07001107 00120100 036E756D

01000149 0100063C 696E6974 3E010003 28295601 0004436F 64650100 0F4C696E

654E756D 62657254 61626C65 01000361 64640100 03282949 01000A53 6F757263

6546696C 6501000A 48656C6C 6F2E6A61 76610C00 0700080C 00050006 01001363

6F6D2F78 6668792F 74657374 2F48656C 6C6F0100 106A6176 612F6C61 6E672F4F

626A6563 74002100 03000400 00~~000100 02000500 060000~~00 02000100 07000800

01000900 00002600 02000100 00000A2A B700012A 04B50002 B1000000 01000A00

00000A00 02000000 03000400 04000100 0B000C00 01000900 00002B00 03000100

00000F2A 2AB40002 0560B500 022AB400 02AC0000 0001000A 0000000A 00020000

0007000A 00080001 000D0000 0002000E

2.6.1 字段表计数器

值为0x0001,因为只有一个字段.

2.6.2 字段表 单个分析

接下来将demo中的这个字段进行分析一下,首先是字段表访问标志,这里的值是0x0002,是什么含义呢?得看下面这张表

值是0x0002代表着private修饰符.访问标志的值为0x0002,查询上面字段访问标志的表格,可得字段为private;

字段名索引的值为0x0005, 查询常量池中的第 5 项, 可得: num

描述符索引的值为0x0006, 查询常量池中的第 6 项, 可得: I

属性计数器的值为0x0000, 即没有任何的属性.

2.7 方法表

接下来是方法表,前面两个字节依然用来表示方法表的容量,我将数据标记了一下:

CAFEBABE 00000034 00130A00 04000F09 00030010 07001107 00120100 036E756D

01000149 0100063C 696E6974 3E010003 28295601 0004436F 64650100 0F4C696E

654E756D 62657254 61626C65 01000361 64640100 03282949 01000A53 6F757263

6546696C 6501000A 48656C6C 6F2E6A61 76610C00 0700080C 00050006 01001363

6F6D2F78 6668792F 74657374 2F48656C 6C6F0100 106A6176 612F6C61 6E672F4F

626A6563 74002100 03000400 00000100 02000500 060000~~00 02000100 07000800

010009~~00 00002600 02000100 00000A2A B700012A 04B50002 B1000000 01000A00

00000A00 02000000 03000400 04000100 0B000C00 01000900 00002B00 03000100

00000F2A 2AB40002 0560B500 022AB400 02AC0000 0001000A 0000000A 00020000

0007000A 00080001 000D0000 0002000E

方法表的容量为0x0002,即demo中有2个方法(还有1个默认的构造方法,别忘了..).

2.7.1 方法表的结构

既然是表,那肯定有结构,还有严格的顺序规定.

2.7.2 方法表访问标志

方法也是有访问标志的

2.7.3 解读方法

第一个方法是:

000100 07000800 010009访问标志的值为0x0001,查询上面字段访问标志的表格,可得字段为 public;

方法名索引的值为0x0007,查询常量池中的第 7 项,可得:

这个名为的方法实际上就是默认的构造方法了。

描述符索引的值为0x0008,查询常量池中的第 8 项,可得:()V

属性计数器的值为0x0001,即这个方法表有一个属性。

属性计数器后面就是属性表了,由于只有一个属性,所以这里也只有一个属性表。

由于涉及到属性表,这里简单说下,下一节会详细介绍。

属性表的前两个字节是属性名称索引,这里的值为0x0009, 查下常量池中的第 9 项:Code.即这是一个Code属性,我们方法里面的代码就是存放在这个 Code 属性里面。相关细节暂且不表。下一节会详细介绍 Code 属性。

先跳过属性表,我们再来看下第二个方法: 000100 0B000C00 010009访问标志的值为0x0001,查询上面字段访问标志的表格,可得字段为 public;

方法名索引的值为0x000b,查询常量池中的第 11 项,可得: add

描述符索引的值为 0x000c,查询常量池中的第 12 项,可得: ()I

属性计数器的值为0x0001,即这个方法表有一个属性。

属性名称索引的值同样也是0x0009,即这是一个 Code 属性。 可以看到,第二个方法表就是我们自定义的add()方法了。

2.8 属性表

上面提到了属性表,现在我们来看一下属性表是什么.

2.8.1 属性类型

属性表实际上有很多类型,上面看到的Code属性只是其中一个.

2.8.2 属性表结构

知道了属性之后,还得知道该属性对应的结构,然后才能解析出来:

可以看到这里的属性表其实只是定义了属性的长度,里面还有一个表用来自定义的,是不定长的,具体的结构是自己去定义的.

2.8.3 Code属性

这里只单独介绍一下Code属性.Code属性就是存放方法体里面的代码,像接口或者抽象方法,它们没有具体的方法体,因此不会有Code属性.

Code属性表结构:

Code属性表的前两项是和属性表是一致的,Code属性是遵循属性表的结构,后面那些是它自定义的结构.

这里我就不再一一去解读Code属性了,就是查字典.

我们可以一步到位,使用javap -verbose Hello可以得到得到字节码指令

public com.xfhy.test.Hello();

descriptor: ()V

flags: ACC_PUBLIC

Code:

stack=2, locals=1, args_size=1

0: aload_0

1: invokespecial #1 // Method java/lang/Object."":()V

4: aload_0

5: iconst_1

6: putfield #2 // Field num:I

9: return

LineNumberTable:

line 3: 0

line 4: 4

public int add();

descriptor: ()I

flags: ACC_PUBLIC

Code:

stack=3, locals=1, args_size=1

0: aload_0

1: aload_0

2: getfield #2 // Field num:I

5: iconst_2

6: iadd

7: putfield #2 // Field num:I

10: aload_0

11: getfield #2 // Field num:I

14: ireturn

LineNumberTable:

line 7: 0

line 8: 10

这里涉及到一些字节码指令,这些指令含义如下表:

当然,这么多属性根本不用记住,需要的时候查表就行.

2.9 附加属性

SourceFile 属性,即附加属性.它的属性结构如下属性名索引的值为0x000d,即常量池中的第 13 项,查询可得: SourceFile

属性长度的值为0x00 00 00 02, 即长度为 2

源码文件索引的值为0x000e, 即常量池中的第 14 项, 查询可得: Hello.java

2.10 其他属性

其他还有一些Java虚拟机预定义了很多属性,就不一一解读了,就是查字典.

3. 总结

Java字节码就是一些Java虚拟机的指令,而这些指令需要依赖class文件,所以首先得读取class文件内容.而class文件内容就是一些16进制的数据,很紧凑地将数据按顺序摆放在一起,只需要顺序解读,即可得到指令内容.❝ ps: 就像《深入理解Java虚拟机》一书中所说的那样,解读class其实就是查字典嘛,来嘛,查嘛,慢慢搞嘛,我就不行治不了你. 刚开始的时候读起来特别不舒服,读不太懂这玩意儿,后面慢慢地终于读懂了,再写篇文章详细记录一下,加深现象. 博客写得不是很详细,如果感兴趣,建议还是看书(《深入理解Java虚拟机》第六章)更系统些.

小声逼逼一句,B乎导入markdown不支持表格,我擦,,贼难受.只能截图上传.

4. 参考:

解读java_Java字节码解读相关推荐

  1. bytecode java_Java 字节码解读

    一.源代码 public classPeople {privateString name;private intage; } 二.利用Javap 反编译查看字节码结构信息 javap -v Peopl ...

  2. PTMs:QLoRA技巧的简介、使用方法、论文解读、源码解读之详细攻略

    PTMs:QLoRA技巧的简介.使用方法.论文解读.源码解读之详细攻略 目录 QLoRA技巧的简介 1.量化.分页优化器 QLoRA技巧的使用方法 1.安装 2.入

  3. 字节码文件(Class文件)结构解读、理解与分析

    字节码(Class文件) 什么是字节码(Class文件)? 字节码(Byte-code)是一种包含执行程序,由一序列 op 代码/数据对组成的二进制文件,是一种中间码.字节是电脑里的数据量单位. 对于 ...

  4. Spring5源码 - 05 invokeBeanFactoryPostProcessors 源码解读_2

    文章目录 Pre 源码解读 总体流程 源码分析 细节解析 [初始化对应的集合 & 遍历用户自己手动添加的后置处理器] [调用实现了PriorityOrdered接口的BeanDefinitio ...

  5. 目标检测之DarkNet-DarkNet源码解读<一>测试篇

    目标检测-DarkNet源码解读 DarkNet源码解读 1.一些思考  1.1 DarkNet的本质  1.2 深度学习分为两条线  1.3 检测任务的步骤 2.代码走读  2.1 程序入口  2. ...

  6. Pytorch源码解读——DataLoader模块

    torch/utils/data/_utils/dataloader.py 通常在使用pytorch训练神经网络时,DataLoader模块是整个网络训练过程中的基础前提且尤为重要,其主要作用是根据传 ...

  7. JVM 调优实战--JVM字节码

    目录 通过javap命令查看class文件的字节码内容 常量池 ​描述符 字段描述符 方法描述符 解读方法字节码 图解 研究i++与++i的不同 查看字节码 对比 分析字符串拼接孰优孰劣 小结 通过j ...

  8. 【JVM学习笔记】-字节码-第一章(多图,多表,实操)

    一 什么是字节码 java中通过编译, 会将我们程序员编写的文件转换成为一种 .class结尾的文件,我们称之为字节码文件.它是一种二进制文件(很明显是给计算机看的文件),是Java虚拟机中运行的文件 ...

  9. 从一个class文件深入理解Java字节码结构

    前言 我们都知道,Java程序最终是转换成class文件执行在虚拟机上的,那么class文件是个怎样的结构,虚拟机又是如何处理去执行class文件里面的内容呢,这篇文章带你深入理解Java字节码中的结 ...

最新文章

  1. python pip
  2. linux命令--VI命令详解(三)
  3. nand ubi -3 uboot和ubi
  4. Python可变参数、关键字参数及命名关键字参数
  5. Pandas 文本数据方法 count( )
  6. Java——JVM基本原理
  7. html toggle自动隐藏,Javascript / HTML – 切换可见性(当另一个div元素呈现可见时自动导致一个div元素隐藏)...
  8. python航空订票系统_航空订票系统 - 智慧点点的个人空间 - OSCHINA - 中文开源技术交流社区...
  9. Android——Binder机制
  10. 大津法(最大类间方差法OTSU)
  11. 决策树系列(四)——基于决策树算法实现员工离职率预测
  12. android九宫格控件,IKNinePhotoView是一个开源的Android九宫格控件
  13. Unity EasyAR3.0 案例解析(一) ------ HelloAR_Coloring3D(涂涂乐)
  14. Python并发编程之进程间通信
  15. 白嫖正版《极客时间》课程的正确姿势
  16. stm32 rgb多彩led驱动
  17. mysql批量替换字段关键词_Mysql批量替换某表里面某个字段的关键字
  18. 【Linux】基本系统维护命令
  19. sqlzoo第七关More JOIN operations
  20. CentOS 5.3启动后报错——ata1.00: error

热门文章

  1. java object 源码_java中Object类 源代码详解
  2. Java 算法 质数的后代
  3. Java 算法 阿尔法乘积
  4. java压缩文件夹(含有空文件夹)
  5. 服务器拒绝访问位置不可用,Win7打开Local Settings文件夹提示“位置不可用,拒绝访问如何解决...
  6. linux配置sftp-server,Ubuntu Server如何配置SFTP(建立用户监狱)
  7. 锐起无盘辅服务器的作用,锐起无盘特殊功用为网吧带来更多收益
  8. aotuwried是java的注解吗_@autowire注入为null
  9. ubuntu mysql 连接_Ubuntu 配置MySQL远程连接
  10. 方法超出 android,Android工程方法数超过64k,The number of method references in a .dex file cannot exceed 64K....