一什么是Java虚拟机
Java虚拟机是一个想象中的机器在实际的计算机上通过软件模拟来实现Java虚拟机有自己想象中的硬件如处理器堆栈寄存器等还具有相应的指令系统
为什么要使用Java虚拟机
Java语言的一个非常重要的特点就是与平台的无关性而使用Java虚拟机是实现这一特点的关键一般的高级语言如果要在不同的平台上运行至少需要编译成不同的目标代码而引入Java语言虚拟机后Java语言在不同平台上运行时不需要重新编译Java语言使用模式Java虚拟机屏蔽了与具体平台相关的信息使得Java语言编译程序只需生成在Java虚拟机上运行的目标代码(字节码)就可以在多种平台上不加修改地运行Java虚拟机在执行字节码时把字节码解释成具体平台上的机器指令执行
谁需要了解Java虚拟机
Java虚拟机是Java语言底层实现的基础对Java语言感兴趣的人都应对Java虚拟机有个大概的了解这有助于理解Java语言的一些性质也有助于使用Java语言对于要在特定平台上实现Java虚拟机的软件人员Java语言的编译器作者以及要用硬件芯片实现Java虚拟机的人来说则必须深刻理解Java虚拟机的规范另外如果你想扩展Java语言或是把其它语言编译成Java语言的字节码你也需要深入地了解Java虚拟机
Java虚拟机支持的数据类型
Java虚拟机支持Java语言的基本数据类型如下:
◆byte://字节有符号整数的补码
◆short://字节有符号整数的补码
◆int://字节有符号整数的补码
◆long://字节有符号整数的补码
◆float://字节IEEE单精度浮点数
◆double://字节IEEE双精度浮点数
◆char://字节无符号Unicode字符
几乎所有的Java类型检查都是在编译时完成的上面列出的原始数据类型的数据在Java执行时不需要用硬件标记操作这些原始数据类型数据的字节码(指令)本身就已经指出了操作数的数据类型例如iaddladdfadd和dadd指令都是把两个数相加其操作数类型别是intlongfloat和double虚拟机没有给boolean(布尔)类型设置单独的指令boolean型的数据是由integer指令包括integer返回来处理的boolean型的数组则是用byte数组来处理的虚拟机使用IEEE格式的浮点数不支持IEEE格式的较旧的计算机在运行Java数值计算程序时可能会非常慢
虚拟机支持的其它数据类型包括:
◆object//对一个Javaobject(对象)的字节引用
◆returnAddress//字节用于jsr/ret/jsrw/retw指令
注:Java数组被当作object处理
虚拟机的规范对于object内部的结构没有任何特殊的要求在Sun公司的实现中对object的引用是一个句柄其中包含一对指针:一个指针指向该object的方法表另一个指向该object的数据用Java虚拟机的字节码表示的程序应该遵守类型规定Java虚拟机的实现应拒绝执行违反了类型规定的字节码程序Java虚拟机由于字节码定义的限制似乎只能运行于位地址空间的机器上但是可以创建一个Java虚拟机它自动地把字节码转换成位的形式从Java虚拟机支持的数据类型可以看出Java对数据类型的内部格式进行了严格规定这样使得各种Java虚拟机的实现对数据的解释是相同的从而保证了Java的与平台无关性和可移植性
二Java虚拟机体系结构
Java虚拟机由五个部分组成:一组指令集一组寄存器一个栈一个无用单元收集堆(Garbagecollectedheap)一个方法区域这五部分是Java虚拟机的逻辑成份不依赖任何实现技术或组织方式但它们的功能必须在真实机器上以某种方式实现
Java指令集
Java虚拟机支持大约个字节码每个字节码执行一种基本的CPU运算例如把一个整数加到寄存器子程序转移等Java指令集相当于Java程序的汇编语言
Java指令集中的指令包含一个单字节的操作符用于指定要执行的操作还有个或多个操作数提供操作所需的参数或数据许多指令没有操作数仅由一个单字节的操作符构成
虚拟机的内层循环的执行过程如下:
do{
取一个操作符字节;
根据操作符的值执行一个动作;
}while(程序未结束)
由于指令系统的简单性使得虚拟机执行的过程十分简单从而有利于提高执行的效率指令中操作数的数量和大小是由操作符决定的如果操作数比一个字节大那么它存储的顺序是高位字节优先例如一个位的参数存放时占用两个字节其值为:
第一个字节*+第二个字节字节码指令流一般只是字节对齐的指令tableswitch和lookup是例外在这两条指令内部要求强制的字节边界对齐
寄存器
Java虚拟机的寄存器用于保存机器的运行状态与微处理器中的某些专用寄存器类似
Java虚拟机的寄存器有四种:
◆pc:Java程序计数器
◆optop:指向操作数栈顶端的指针
◆frame:指向当前执行方法的执行环境的指针
◆vars:指向当前执行方法的局部变量区第一个变量的指针
Java虚拟机
Java虚拟机是栈式的它不定义或使用寄存器来传递或接受参数其目的是为了保证指令集的简洁性和实现时的高效性(特别是对于寄存器数目不多的处理器)
所有寄存器都是位的
栈
Java虚拟机的栈有三个区域:局部变量区运行环境区操作数区
()局部变量区每个Java方法使用一个固定大小的局部变量集它们按照与vars寄存器的字偏移量来寻址局部变量都是位的长整数和双精度浮点数占据了两个局部变量的空间却按照第一个局部变量的索引来寻址(例如一个具有索引n的局部变量如果是一个双精度浮点数那么它实际占据了索引n和n+所代表的存储空间)虚拟机规范并不要求在局部变量中的位的值是位对齐的虚拟机提供了把局部变量中的值装载到操作数栈的指令也提供了把操作数栈中的值写入局部变量的指令
()运行环境区在运行环境中包含的信息用于动态链接正常的方法返回以及异常传播
◆动态链接
运行环境包括对指向当前类和当前方法的解释器符号表的指针用于支持方法代码的动态链接方法的class文件代码在引用要调用的方法和要访问的变量时使用符号动态链接把符号形式的方法调用翻译成实际方法调用装载必要的类以解释还没有定义的符号并把变量访问翻译成与这些变量运行时的存储结构相应的偏移地址动态链接方法和变量使得方法中使用的其它类的变化不会影响到本程序的代码
◆正常的方法返回
如果当前方法正常地结束了在执行了一条具有正确类型的返回指令时调用的方法会得到一个返回值执行环境在正常返回的情况下用于恢复调用者的寄存器并把调用者的程序计数器增加一个恰当的数值以跳过已执行过的方法调用指令然后在调用者的执行环境中继续执行下去
◆异常和错误传播
异常情况在Java中被称作Error(错误)或Exception(异常)是Throwable类的子类在程序中的原因是:①动态链接错如无法找到所需的class文件②运行时错如对一个空指针的引用
·程序使用了throw语句
当异常发生时Java虚拟机采取如下措施:
·检查与当前方法相联系的catch子句表每个catch子句包含其有效指令范围能够处理的异常类型以及处理异常的代码块地址
·与异常相匹配的catch子句应该符合下面的条件:造成异常的指令在其指令范围之内发生的异常类型是其能处理的异常类型的子类型如果找到了匹配的catch子句那么系统转移到指定的异常处理块处执行;如果没有找到异常处理块重复寻找匹配的catch子句的过程直到当前方法的所有嵌套的catch子句都被检查过
·由于虚拟机从第一个匹配的catch子句处继续执行所以catch子句表中的顺序是很重要的因为Java代码是结构化的因此总可以把某个方法的所有的异常处理器都按序排列到一个表中对任意可能的程序计数器的值都可以用线性的顺序找到合适的异常处理块以处理在该程序计数器值下发生的异常情况
·如果找不到匹配的catch子句那么当前方法得到一个未截获异常的结果并返回到当前方法的调用者好像异常刚刚在其调用者中发生一样如果在调用者中仍然没有找到相应的异常处理块那么这种错误传播将被继续下去如果错误被传播到最顶层那么系统将调用一个缺省的异常处理块
()操作数栈区机器指令只从操作数栈中取操作数对它们进行操作并把结果返回到栈中选择栈结构的原因是:在只有少量寄存器或非通用寄存器的机器(如Intel)上也能够高效地模拟虚拟机的行为操作数栈是位的它用于给方法传递参数并从方法接收结果也用于支持操作的参数并保存操作的结果例如iadd指令将两个整数相加相加的两个整数应该是操作数栈顶的两个字这两个字是由先前的指令压进堆栈的这两个整数将从堆栈弹出相加并把结果压回到操作数栈中
每个原始数据类型都有专门的指令对它们进行必须的操作每个操作数在栈中需要一个存储位置除了long和double型它们需要两个位置操作数只能被适用于其类型的操作符所操作例如压入两个int类型的数如果把它们当作是一个long类型的数则是非法的在Sun的虚拟机实现中这个限制由字节码验证器强制实行但是有少数操作(操作符dupe和swap)用于对运行时数据区进行操作时是不考虑类型的
无用单元收集堆
Java的堆是一个运行时数据区类的实例(对象)从中分配空间Java语言具有无用单元收集能力:它不给程序员显式释放对象的能力Java不规定具体使用的无用单元收集算法可以根据系统的需求使用各种各样的算法
方法区
方法区与传统语言中的编译后代码或是Unix进程中的正文段类似它保存方法代码(编译后的java代码)和符号表在当前的Java实现中方法代码不包括在无用单元收集堆中但计划在将来的版本中实现每个类文件包含了一个Java类或一个Java界面的编译后的代码可以说类文件是Java语言的执行代码文件为了保证类文件的平台无关性Java虚拟机规范中对类文件的格式也作了详细的说明其具体细节请参考Sun公司的Java虚拟机规范