记得vamcily 曾问我为什么获取数组的长度用length(成员变量的形式)而获取String的长度用length()(成员方法的形式)?
我当时一听觉得问得很有道理做同样一件事情为什么采用两种风格迥异的风格呢?况且Java中的数组其实是完备(full fledged)的对象直接暴露成员变量可能不是一种很OO的风格那么设计Java的那帮天才为什么这么做呢?
带着这个疑问我查阅了一些资料主要是关于JVM是如何处理数组的
数组对象的类是什么?
既然数组都是对象那么数组的类究竟是什么呢?当然不是javautilArrays啦!我们以int一维数组为例看看究竟
public class Main {
public static void main(String args[]){
int a[] = new int[]; Class clazz = agetClass();
Systemoutprintln(clazzgetName());
}
}
在SUN JDK 上运行上述代码输出为
[I
看起来数组的类很奇怪非但不属于任何包而且名称还不是合法的标识符(identifier)具体的命名规则[]可以参见 javalangClassgetName()的javadoc简单的说数组的类名由若干个[和数组元素类型的内部名称组成[的数目 代表了数组的维度
具有相同类型元素和相同维度的数组属于同一个类如果两个数组的元素类型相同但维度不同那么它们也属于不同的类如果两个数组的元素类型 和维度均相同但长度不同那么它们还是属于同一个类
数组的类有哪些成员呢?
既然我们知道了数组的类名是什么那么就去看看数组的类究竟是什么样的吧?有哪些成员变量?有哪些成员方法?length这个成员变量在哪?是 不是没有length()这个成员方法?
找来找去在JDK的代码中没有找打[I这个类想想也对[I都不是一个合法的标识符肯定不会出现public class [I {}这样的Java代码我们暂且不管[I类是谁声明的怎么声明的先用反射机制一探究竟吧
public class Main {
public static void main(String[] args) {
int a[] = new int[]; Class clazz = agetClass();
Systemoutprintln(clazzgetDeclaredFields()length);
Systemoutprintln(clazzgetDeclaredMethods()length);
Systemoutprintln(clazzgetDeclaredConstructors()length);
Systemoutprintln(clazzgetDeclaredAnnotations()length);
Systemoutprintln(clazzgetDeclaredClasses()length);
Systemoutprintln(clazzgetSuperclass());
}
}
在SUN JDK 上运行上述代码输出为
class javalangObject 可见[I这个类是javalangObject的直接子类自身没有声明任何成员变量成员方法构造函数和Annotation可以说[I就 是个空类我们立马可以想到一个问题怎么连length这个成员变量都没有呢?如果真的没有编译器怎么不报语法错呢?想必编译器对 Arraylength进行了特殊处理哇!
数组的类在哪里声明的?
先不管为什么没有length成员变量我们先搞清楚[I这个类是哪里声明的吧既然[I都不是合法的标识符那么这个类肯定在Java代码中 显式声明的想来想去只能是JVM自己在运行时生成的了JVM生成类还是一件很容易的事情甚至无需生成字节码直接在方法区中创建类型数据就差不 多完工了
还没有实力去看JVM的源代码于是翻了翻The JavaTM Virtual Machine Specification Second Edition果然得到了验证相关内容参考 Creating Array Classes
规范的描述很严谨还掺杂了定义类加载器和初始化类加载器的内容先不管这些简单概括一下
类加载器先看看数组类是否已经被创建了如果没有那就说明需要创建数组类如果有那就无需创建了
如果数组元素是引用类型那么类加载器首先去加载数组元素的类
JVM根据元素类型和维度创建相应的数组类
呵呵果然是JVM这家伙自个偷偷创建了[I类JVM不把数组类放到任何包中也不给他们起个合法的标识符名称估计是为了避免和JDK第 三方及用户自定义的类发生沖突吧
再想想JVM也必须动态生成数组类因为Java数组类的数量与元素类型维度(最多)有关相当相当多了是没法预先声明好的
居然没有length这个成员变量!
我们已经发现偷懒的JVM没有为数组类生成length这个成员变量那么Arraylength这样的语法如何通过编译如何执行的呢?
让我们看看字节码吧!编写一段最简单的代码使用jclasslib查看字节码
public class Main {
public static void main(String[] args) {
int a[] = new int[]; int i = alength;
}
}
使用SUN JDK 编译上述代码并使用jclasslib打开Mainclass文件得到main方法的字节码
iconst_ //将int型常量压入操作数栈 newarray (int) //将弹出操作数栈作为长度创建一个元素类型为int 维度为的数组并将数组的引用压入操作数栈 astore_ //将数组的引用从操作数栈中弹出保存在索引为的局部变量(即a)中 aload_ //将索引为的局部变量(即a)压入操作数栈 arraylength //从操作数栈弹出数组引用(即a)并获取其长度(JVM负责实现如何获取)并将长度压入操作数栈 istore_ //将数组长度从操作数栈弹出保存在索引为的局部变量(即i)中 return //main方法返回 可见在这段字节码中根本就没有看见length这个成员变量获取数组长度是由一条特定的指令arraylength实现(怎么实现就不管了JVM 总有办法)编译器对Arraylength这样的语法做了特殊处理直接编译成了arraylength指令另外JVM创建数组类应该就是由 newarray这条指令触发的了
很自然地想到编译器也可以对Arraylength()这样的语法做特殊处理直接编译成arraylength指令这样的话我们就可 以使用方法调用的风格获取数组的长度了这样看起来貌似也更加OO一点那为什么不使用Arraylength()的语法呢?也许是开发Java的那帮 天才对length有所偏爱或者抛硬币拍脑袋随便决定的吧 形式不重要重要的是我们明白了背后的机理
Array in Java
最后对Java中纯对象的数组发表点感想吧
相比C/C++中的数组Java数组在安全性要好很多C/C++常遇到的缓存区溢出或数组访问越界的问题在Java中不再存在因为 Java使用特定的指令访问数组的元素这些指令都会对数组的长度进行检查如果发现越界就会抛出 javalangArrayIndexOutOfBoundsException
Java数组元素的灵活性比较大一个数组的元素本身也可以是数组只要所有元素的数组类型相同即可我们知道数组的类型和长度无关因此元素 可以是长度不同的数组这样Java的多维数组就不一定是规规矩矩的矩阵了可以千变万化