JVM
运行时数据区域
根据《Java 虚拟机规范(Java SE 7 版)》规定,Java 虚拟机所管理的内存如下图所示。
程序计数器
内存空间小,线程私有.
字节码解释器工作时就是通过改变程序计数器的值来选取下一条需要执行指令的字节码指令(主要是取下一条指令的字节码文件).
分支,循环,跳转,异常处理,线程恢复等基础功能都依赖程序计数器来完成.
如果线程正在执行一个Java方法,这个计数器记录的是正在执行的虚拟机字节码指令的地址 ;
如果正在执行的是Native方法, 这个计数器记录的值为(Undefined).
此内存区域是唯一一个在Java虚拟机中没有规定任何OutOfMemoryError
情况的区域.
Java虚拟机栈
线程私有,生命周期和线程一致.
描述的是Java方法执行的内存模型:每个方法在执行时都会创建一个栈帧(Stack Frame)用于存储局部变量表,操作数栈,动态链接,方法出口等信息.
每一个方法从调用到执行结束,就对应着一个栈帧从虚拟机栈中入栈到出栈的过程.
局部变量表 : 存放了编译期可知的各种基本类型(boolean, byte, char, short, int, float, long, double), 对象引用(reference类型) 和 returnAddress类型(指向了一条字节码指令的地址).
StackOverflowError:线程请求的栈深度大于虚拟机所允许的深度。 OutOfMemoryError:如果虚拟机栈可以动态扩展,而扩展时无法申请到足够的内存。
本地方法栈
区别于Java虚拟机栈的是,Java虚拟机栈为虚拟机执行java方法(也就是字节码)服务, 而本地方法栈则为虚拟机使用到的Native方法服务.
也会有StackOverflowError和OutOfMemoryError异常.
Java堆
线程共享
对于绝大部分应用来说,Java堆这块区域是JVM所管理的内存中最大的一块.
主要存放对象实例和数组.
内部会划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB).
可以位于物理上不连续的空间,但是逻辑上要连续。
堆是在虚拟机启动时创建的.
OutOfMemoryError:如果堆中没有内存完成实例分配,并且堆也无法再扩展时(计算需要的堆数超过自动存储管理系统可用的堆数)抛出该异常。
方法区
属于共享内存区域, 存储已被加载的类信息,常量,静态变量,即时编译器编译后的代码等数据.
方法区域在虚拟机启动时创建.
如果方法区中的内存无法满足分配请求,Java 虚拟机将引发 OutOfMemoryError
.
运行时常量池
属于方法区的一部分,用于存放编译期生成的各种字面量和符号引用.
编译期和运行期(String 的 intern() )都可以将常量放入池中.
内存有限,无法申请时排除OutOfMemoryError
创建类或接口时,如果运行时常量池的构造需要的内存多于 Java 虚拟机的方法区中可用的内存,则 Java 虚拟机将引发一个 OutOfMemoryError
.
直接内存
非虚拟机运行时数据区的部分
在 JDK 1.4 中新加入 NIO (New Input/Output) 类,引入了一种基于通道(Channel)和缓存(Buffer)的 I/O 方式,它可以使用 Native 函数库直接分配堆外内存,然后通过一个存储在 Java 堆中的 DirectByteBuffer 对象作为这块内存的引用进行操作。可以避免在 Java 堆和 Native 堆中来回的数据耗时操作。 OutOfMemoryError:会受到本机内存限制,如果内存区域总和大于物理内存限制从而导致动态扩展时出现该异常。
垃圾回收器与内存分配策略
程序计数器,虚拟机栈和本地方法栈3个区域随线程生灭,栈中的栈针随着方法的进入和退出执行出栈和入栈的操作.
Java堆和方法区不一样,一个接口中的多个实现类需要的内存可能不一样,一个方法中的多个分支需要的内存可能也不一样,我们只有在程序处于运行期才知道哪些对象会创建,这部分内存的分配和回收都是动态的,垃圾回收所关注的就是这部分内存.
判断对象是否需要回收
引用计数法
每个对象有一个引用计数器,当对象被引用一次则计数器加1,当对应引用失效1次则计数器减1,对于计数器为0的对象意味着是垃圾对象,可以被GC回收.
缺点: Java堆中保持相互引用的对象无法回收,难以解决循环引用问题
可达性算法
从GC Roots作为起点开始搜索,从这些节点出发所走过的路径称为引用链. 那么整个链中的对象就是活对象.
对于GC Roots无法到达的对象随时可能被GC回收.
可作为 GC Roots 的对象:
- 虚拟机栈(栈帧中的本地变量表)中引用的对象
- 方法区中静态变量和常量引用的对象
- 本地方法栈中 JNI(即一般说的 Native 方法) 引用的对象
引用
前面的算法判断存活都与’引用’有关.
下面4种引用,强度依次递减.
强引用
类似于Object obj = new Object();创建的 obj指向Object实例所在的堆空间.
强引用是使用最普遍的引用。如果一个对象具有强引用,那么垃圾回收器绝不会回收它
强引用特点:
- 强引用可以直接访问目标对象
- 只要有引用变量存在,垃圾回收器永远不会回收。JVM即使抛出OOM异常,也不会回收强引用所指向的对象。
- 强引用可能导致内存泄漏问题
软引用
可以通过java.lang.ref.SoftReference类实现软引用.在系统要发生内存溢出之前,将会把这些对象列进回收范围中进行二次回收.
一个持有软引用的对象,不会被JVM很快回收,JVM会判断当前堆的使用情况来判断何时回收.
当堆的使用率临近阈值时,才回去回收软引用的对象.
软引用主要用来实现类似缓存的功能,在内存足够的情况下直接通过软引用取值,无需从繁忙的真实来源查询数据,提升速度;
当内存不足时,自动删除这部分缓存数据,从真正的来源查询这些数据。使用软引用能防止内存泄露,增强程序的健壮性。
弱引用
在java中,可以用java.lang.ref.WeakReference实例来保存对一个Java对象的弱引用。
在系统GC时,不管系统堆空间是否足够,都会将对象进行回收.
虚引用
可以通过PhantomReference 类实现虚引用. 无法通过虚引用获取一个对象的实例,为一个对象设置虚引用关联的唯一目的就是能在这个对象被收集器回收时收到一个系统通知。
一个持有虚引用的对象和没有引用几乎是一样的,随时可能被垃圾回收器回收.
它的作用在于检测对象是否已经从内存中删除,跟踪垃圾回收过程.
垃圾回收算法
标记清除法
标记清除法是最基础的收集算法 ,它分为"标记"和"清除"两个阶段:
首先标记出需要回收的对象,在标记完成后统一回收掉被标记的对象,它的标记过程其实就是前面的可达性分析算法中判定垃圾对象的标记过程.
- 回收前:
- 回收后:
缺点:
- 标记和清除的效率都不高
- 标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致需要分配较大对象时无法找到足够的连续内存而不得不触发另一次垃圾回收操作.
复制算法
它将内存按容量分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存货的对象复制到另一块内存上面 , 然后再把已使用的内存空间一次清理掉.
优点:
- 每次只对一块内存进行回收,运行高效
- 只需移动栈顶的指针,按顺序分配内存即可,实现简单
- 内存回收时不用考虑内存碎片的出现
缺点:
- 可一次分配的内存缩小了一半
- 空间利用率下降
因为大多数新生代对象都不会熬过第一次 GC。所以没必要 1 : 1 划分空间。可以分一块较大的 Eden 空间和两块较小的 Survivor 空间,每次使用 Eden 空间和其中一块 Survivor。当回收时,将 Eden 和 Survivor 中还存活的对象一次性复制到另一块 Survivor 上,最后清理 Eden 和 Survivor 空间。大小比例一般是 8 : 1 : 1,每次浪费 10% 的 Survivor 空间。但是这里有一个问题就是如果存活的大于 10% 怎么办?这里采用一种分配担保策略:多出来的对象直接进入老年代。
- 回收前:
- 回收后:
标记整理法
复制算法比较适合于新生代,在老年代中,对象存活率比较高,如果执行较多的复制操作,效率将会变低,所以老年代一般会选用其他算法,如标记—整理算法。
该算法标记过程和标记清除法中的标记过程一样,然后把存活对象移到内存的一端,然后直接清理掉端边界以外的内存。
- 回收前:
- 回收后:
分代回收
根据存活对象划分几块内存区,一般是分为新生代和老年代。然后根据各个年代的特点制定相应的回收算法。
- 在新生代中,每次垃圾收集时都会发现有大量对象死去,只有少量存活,因此可选用复制算法来完成收集
- 老年代中因为对象存活率高、没有额外空间对它进行分配担保,就必须使用标记—清除算法或标记—整理算法来进行回收