Java堆的管理--透视垃圾回收机制-java-IT落伍者

引言

Java的堆是一个运行时数据区类的实例(对象)从中分配空间Java虚拟机(JVM)的堆中储存着正在运行的应用程序所建立的所有对象这些对象通过newnewarrayanewarray和multianewarray等指令建立但是它们不需要程序代码来显式地释放一般来说堆的是由垃圾回收来负责的尽管JVM规范并不要求特殊的垃圾回收技术甚至根本就不需要垃圾回收但是由于内存的有限性JVM在实现的时候都有一个由垃圾回收所管理的堆垃圾回收是一种动态存储管理技术它自动地释放不再被程序引用的对象按照特定的垃圾收集算法来实现资源自动回收的功能

垃圾收集的意义

在C++中对象所占的内存在程序结束运行之前一直被占用在明确释放之前不能分配给其它对象而在Java中当没有对象引用指向原先分配给某个对象的内存时该内存便成为垃圾JVM的一个系统级线程会自动释放该内存块垃圾收集意味着程序不再需要的对象是无用信息这些信息将被丢弃当一个对象不再被引用的时候内存回收它占领的空间以便空间被后来的新对象使用事实上除了释放没用的对象垃圾收集也可以清除内存记录碎片由于创建对象和垃圾收集器释放丢弃对象所占的内存空间内存会出现碎片碎片是分配给对象的内存块之间的空闲内存洞碎片整理将所占用的堆内存移到堆的一端JVM将整理出的内存分配给新的对象

垃圾收集能自动释放内存空间减轻编程的负担这使Java 虚拟机具有一些优点首先它能使编程效率提高在没有垃圾收集机制的时候可能要花许多时间来解决一个难懂的存储器问题在用Java语言编程的时候靠垃圾收集机制可大大缩短时间其次是它保护程序的完整性垃圾收集是Java语言安全性策略的一个重要部份

垃圾收集的一个潜在的缺点是它的开销影响程序性能Java虚拟机必须追蹤运行程序中有用的对象而且最终释放没用的对象这一个过程需要花费处理器的时间其次垃圾收集算法的不完备性早先采用的某些垃圾收集算法就不能保证%收集到所有的废弃内存当然随着垃圾收集算法的不断改进以及软硬件运行效率的不断提升这些问题都可以迎刃而解

垃圾收集的算法分析

Java语言规范没有明确地说明JVM使用哪种垃圾回收算法但是任何一种垃圾收集算法一般要做件基本的事情（）发现无用信息对象（）回收被无用对象占用的内存空间使该空间可被程序再次使用

大多数垃圾回收算法使用了根集(root set)这个概念所谓根集就量正在执行的Java程序可以访问的引用变量的集合(包括局部变量参数类变量)程序可以使用引用变量访问对象的属性和调用对象的方法垃圾收集首选需要确定从根开始哪些是可达的和哪些是不可达的从根集可达的对象都是活动对象它们不能作为垃圾被回收这也包括从根集间接可达的对象而根集通过任意路径不可达的对象符合垃圾收集的条件应该被回收下面介绍几个常用的算法

引用计数法(Reference Counting Collector)

引用计数法是唯一没有使用根集的垃圾回收得法该算法使用引用计数器来区分存活对象和不再使用的对象一般来说堆中的每个对象对应一个引用计数器当每一次创建一个对象并赋给一个变量时引用计数器置为当对象被赋给任意变量时引用计数器每次加当对象出了作用域后(该对象丢弃不再使用)引用计数器减一旦引用计数器为对象就满足了垃圾收集的条件

基于引用计数器的垃圾收集器运行较快不会长时间中断程序执行适宜地必须实时运行的程序但引用计数器增加了程序执行的开销因为每次对象赋给新的变量计数器加而每次现有对象出了作用域生计数器减

tracing算法(Tracing Collector)

tracing算法是为了解决引用计数法的问题而提出它使用了根集的概念基于tracing算法的垃圾收集器从根集开始扫描识别出哪些对象可达哪些对象不可达并用某种方式标记可达对象例如对每个可达对象设置一个或多个位在扫描识别过程中基于tracing算法的垃圾收集也称为标记和清除(markandsweep)垃圾收集器

compacting算法(Compacting Collector)

为了解决堆碎片问题基于tracing的垃圾回收吸收了Compacting算法的思想在清除的过程中算法将所有的对象移到堆的一端堆的另一端就变成了一个相邻的空闲内存区收集器会对它移动的所有对象的所有引用进行更新使得这些引用在新的位置能识别原来的对象在基于Compacting算法的收集器的实现中一般增加句柄和句柄表

coping算法(Coping Collector)

该算法的提出是为了克服句柄的开销和解决堆碎片的垃圾回收它开始时把堆分成一个对象面和多个空闲面程序从对象面为对象分配空间当对象满了基于coping算法的垃圾收集就从根集中扫描活动对象并将每个活动对象复制到空闲面(使得活动对象所占的内存之间没有空闲洞)这样空闲面变成了对象面原来的对象面变成了空闲面程序会在新的对象面中分配内存

一种典型的基于coping算法的垃圾回收是stopandcopy算法它将堆分成对象面和空闲区域面在对象面与空闲区域面的切换过程中程序暂停执行

generation算法(Generational Collector)

stopandcopy垃圾收集器的一个缺陷是收集器必须复制所有的活动对象这增加了程序等待时间这是coping算法低效的原因在程序设计中有这样的规律多数对象存在的时间比较短少数的存在时间比较长因此generation算法将堆分成两个或多个每个子堆作为对象的一代(generation)由于多数对象存在的时间比较短随着程序丢弃不使用的对象垃圾收集器将从最年轻的子堆中收集这些对象在分代式的垃圾收集器运行后上次运行存活下来的对象移到下一最高代的子堆中由于老一代的子堆不会经常被回收因而节省了时间

adaptive算法(Adaptive Collector)

在特定的情况下一些垃圾收集算法会优于其它算法基于Adaptive算法的垃圾收集器就是监控当前堆的使用情况并将选择适当算法的垃圾收集器

透视Java垃圾回收

命令行参数透视垃圾收集器的运行

使用Systemgc()可以不管JVM使用的是哪一种垃圾回收的算法都可以请求Java的垃圾回收在命令行中有一个参数verbosegc可以查看Java使用的堆内存的情况它的格式如下

java verbosegc classfile

可以看个例子

class TestGC

{

public static void main(String[] args)

{

new TestGC();

Systemgc();

SystemrunFinalization();

}

在这个例子中一个新的对象被创建由于它没有使用所以该对象迅速地变为可达程序编译后执行命令 java verbosegc TestGC 后结果为

[Full GC K>K(K) secs]

机器的环境为Windows + JDK箭头前后的数据K和K分别表示垃圾收集GC前后所有存活对象使用的内存容量说明有KK=K的对象容量被回收括号内的数据K为堆内存的总容量收集所需要的时间是秒（这个时间在每次执行的时候会有所不同）

finalize方法透视垃圾收集器的运行

在JVM垃圾收集器收集一个对象之前一般要求程序调用适当的方法释放资源但在没有明确释放资源的情况下Java提供了缺省机制来终止化该对象心释放资源这个方法就是finalize（）它的原型为

protected void finalize() throws Throwable

在finalize()方法返回之后对象消失垃圾收集开始执行原型中的throws Throwable表示它可以抛出任何类型的异常

之所以要使用finalize()是由于有时需要采取与Java的普通方法不同的一种方法通过分配内存来做一些具有C风格的事情这主要可以通过固有方法来进行它是从Java里调用非Java方法的一种方式C和C++是目前唯一获得固有方法支持的语言但由于它们能调用通过其他语言编写的子程序所以能够有效地调用任何东西在非Java代码内部也许能调用C的malloc()系列函数用它分配存储空间而且除非调用了free()否则存储空间不会得到释放从而造成内存漏洞的出现当然free()是一个C和C++函数所以我们需要在finalize()内部的一个固有方法中调用它也就是说我们不能过多地使用finalize()它并不是进行普通清除工作的理想场所

在普通的清除工作中为清除一个对象那个对象的用户必须在希望进行清除的地点调用一个清除方法这与C++破坏器的概念稍有抵触在C++中所有对象都会破坏（清除）或者换句话说所有对象都应该破坏若将C++对象创建成一个本地对象比如在堆栈中创建（在Java中是不可能的）那么清除或破坏工作就会在结束花括号所代表的创建这个对象的作用域的末尾进行若对象是用new创建的（类似于Java）那么当程序员调用C++的delete命令时（Java没有这个命令）就会调用相应的破坏器若程序员忘记了那么永远不会调用破坏器我们最终得到的将是一个内存漏洞另外还包括对象的其他部分永远不会得到清除

相反Java不允许我们创建本地（局部）对象无论如何都要使用new但在Java中没有delete命令来释放对象因为垃圾收集器会帮助我们自动释放存储空间所以如果站在比较简化的立场我们可以说正是由于存在垃圾收集机制所以Java