JVM-2.垃圾回收
二、垃圾回收
1. 如何判断对象可以回收
1.1引用计数法
- 有引用+1
- 断开引用-1
- 弊端:循环依赖问题
- java未使用该方法

1.2 可达性分析计算法
Java 虚拟机中的垃圾回收器采用可达性分析来探索所有存活的对象
扫描堆中的对象,看是否能够沿着 GC Root对象 为起点的引用链找到该对象,找不到,表示可以 回收
哪些对象可以作为 GC Root ?
类比葡萄串🍇,提起葡萄还在根上的就不能被回收
案例:保存jmap状态
1 | ❯ jps |
- 用
mat软件打开分析 GC ROOT
1.3 四种引用
强引用- 只有所有 GC Roots 对象都不通过【强引用】引用该对象,该对象才能被垃圾回收
软引用(SoftReference)- 仅有软引用引用该对象时,在垃圾回收后,内存仍不足时会再次出发垃圾回收,回收软引用 对象
- 可以配合引用队列来释放软引用自身
弱引用(WeakReference)- 仅有弱引用引用该对象时,在垃圾回收时,无论内存是否充足,都会回收弱引用对象
- 可以配合引用队列来释放弱引用自身
虚引用(PhantomReference)- 必须配合引用队列使用,主要配合 ByteBuffer 使用,被引用对象回收时,会将虚引用入队, 由 Reference Handler 线程调用虚引用相关方法释放直接内存
终结器引用(FinalReference)- 无需手动编码,但其内部配合引用队列使用,在垃圾回收时,终结器引用入队(被引用对象 暂时没有被回收),再由 Finalizer 线程通过终结器引用找到被引用对象并调用它的 finalize 方法,第二次 GC 时才能回收被引用对象
强软弱
- 实线是强引用

软 弱引用断开- 内存不够回收软引用
- 无论充足与否都回收弱引用
- 然后放入
引用队列(可以使用)
虚终
- 必须使用引用队列
- 虚引用,放入引用队列,线程扫描队列主动释放
直接内存 - 终结引用
- 每个类继承自Object类,有一个
finallize方法 (不推荐) - 放入引用队列
由finalizeHandler扫描释放
- 每个类继承自Object类,有一个
软引用
1 | /** |
- 使用普通方法分配内存 出现内存溢出
- 使用软引用结果:
- 观察到有四个null
1 | [B@4554617c |
软引用+引用队列
1 | /** |
- 结果:
- 四个null被回收
1 | [B@4554617c |
弱引用
- 代码
1 | /** |
- 结果:
null [B@74a14482 [B@1540e19d [B@677327b6 null null null null null [B@330bedb4null为回收的数组对象
1 | [B@4554617c |
2. 垃圾回收算法
2.1 标记清除法
- 定义: Mark Sweep
- 标记:没被
GC Root直接引用的对象标记为垃圾(灰色) - 优缺点
- 速度较快
- 会造成内存碎片

2.2 标记整理
- 定义:Mark Compact
- 清除之后
紧凑操作 (类似OS)- 速度慢
- 没有内存碎片

2.3 复制
定义:Copy
- 不会有内存碎片
- 需要占用双倍内存空间
标记

复制移动

全部清除左边

交换

2.4 总结
- 以上三种都会用到,接下来介绍
分代垃圾回收机制
3. 分代垃圾回收
对象首先分配在伊甸园区域
新生代空间不足时,触发
minor gc,伊甸园和 from存活的对象使用copy 复制到幸存区to中,存活的 对象年龄加 1并且交换from和to第二次
minor gcminor gc 会引发
stop the world,暂停其它用户的线程,等垃圾回收结束,用户线程才恢复运行当对象寿命超过阈值时,会晋升至老年代,最大寿命是15(4bit)
当老年代空间不足,会先尝试触发
minor gc,如果之后空间仍不足,那么触发full gc,STW的时 间更长、理解
- 新生代类似日常垃圾,每个居民放在垃圾桶
- 老年代类似破椅子,破电视,先暂存家里,定时大清理

3.1 相关VM参数
| 含义 | 参数 |
|---|---|
| 堆初始大小 | -Xms |
| 堆最大大小 | -Xmx 或 -XX:MaxHeapSize=size |
| 新生代大小 | -Xmn 或 (-XX:NewSize=size + -XX:MaxNewSize=size ) |
| 幸存区比例(动态) | -XX:InitialSurvivorRatio=ratio 和 -XX:+UseAdaptiveSizePolicy |
| 幸存区比例 | -XX:SurvivorRatio=ratio |
| 晋升阈值 | -XX:MaxTenuringThreshold=threshold |
| 晋升详情 | -XX:+PrintTenuringDistribution |
| GC详情 | -XX:+PrintGCDetails -verbose:gc |
| FullGC 前 MinorGC | -XX:+ScavengeBeforeFullGC |
3.2 GC演示
新生代
-Xmn10M10mb老年代:
10mb新生代默认
1mb from; 1mb to; eden 8mb放入7mb,触发GC
1 | /** |
minor GC 默认写
GC
大对象回收- 放入8mb,新生代放不下,直接晋升老年代
1 | /** |

OOM- 子线程内存溢出,不会导致主线程终止
1 | /** |

4. 垃圾回收器
- 串行
- 单线程
- 堆内存较小,适合个人电脑
- 吞吐量优先
- 多线程
- 堆内存较大,多核 cpu
- 让单位时间内,
STW的时间最短(总共时间最短)0.2+0.2 = 0.4,垃圾回收时间占比最低,这样就称吞吐量高
- 响应时间优先
- 多线程
- 堆内存较大,多核 cpu
- 尽可能让单次 STW 的时间最短 (单词时间最短)
0.1 0.1 0.1 0.1 0.1 = 0.5
4.1 串行
- 使用:
-XX:+UseSerialGC = Serial + SerialOldSerial使用复制算法SerialOld老年代
- 回收过程
cpu0 1 2 3都在运行- 发生垃圾回收时,都在安全点停下来
- 垃圾回收线程运行,其他线程阻塞
- 回收后 其他线程运行

4.2 吞吐量优先
-XX:+UseParallelGC ~ -XX:+UseParallelOldGC- 开启一个自动开启另一个
-XX:+UseAdaptiveSizePolicy- 采用自适应大小策略
- 新生代大小:
Eden和幸存区, 晋升阈值
-XX:GCTimeRatio=ratio- 垃圾回收时间和总时间占比 (1/(1+ratio))
-XX:MaxGCPauseMillis=ms- 最大暂停毫秒数
- 默认
200ms - 和上一个配置矛盾,折中
-XX:ParallelGCThreads=n- 控制线程数
不同点:
- 安全点后:开启多个垃圾回收线程

- 安全点后:开启多个垃圾回收线程
4.3 响应时间优先
-XX:+UseConcMarkSweepGC ~ -XX:+UseParNewGC ~ SerialOld- 解释:concurrent(并发的) mark(标记)sweep(清除)
- CMS(Concurrent Mark-Sweep) 并发标记清除回收机制
- (区别并发与并行)并发:交替进行;并行:同时发生
UseConcMarkSweepGC:工作在老年代UseParNewGC:工作在新生代- 新老有碎片,内存都不足时,退化为
SerialOld做串行回收
-XX:ParallelGCThreads=n ~ -XX:ConcGCThreads=threads- 设置并发数:一般是占1/4
-XX:CMSInitiatingOccupancyFraction=percent- cms执行垃圾回收时的占比
- percent百分比越小,执行越早
- 早期cms 65%左右
-XX:+CMSScavengeBeforeRemark- 重新标记:新生代可能用到老年代,需要重新扫描一遍

- 重新标记:新生代可能用到老年代,需要重新扫描一遍
4.1 G1 (重点)
定义:Garbage First
2004 论文发布
2009 JDK 6u14 体验
2012 JDK 7u4 官方支持
2017 JDK 9 默认
适用场景
- 同时注重吞吐量(
Throughput)和低延迟(Low latency),默认的暂停目标是 200 ms - 适用超大堆内存,会将堆划分为多个大小相等的
Region - 整体上是
标记+整理算法,两个区域(Region)之间是复制算法
相关 JVM 参数:
- 同时注重吞吐量(
-XX:+UseG1GC- JDK8 不默认,需要手动开启
- JDK9 及以后自动开启
-XX:G1HeapRegionSize=size- 设置区域大小 (1 2 4 8 16)
-XX:MaxGCPauseMillis=time
1)G1垃圾回收阶段
- 新生代垃圾收集
- 新生代垃圾收集+并发标记
- 混合收集
- 将内存分为很多区域:
Region,每个区域都可作为eden 幸存区 老年代
2)Young Collection(新生代回收)
- 会 STW
- 此时其他线程阻塞,只有垃圾回收线程运行
- E:eden 伊甸园

- 新生区:eden复制copy到 S(幸存区Servival)

- 幸存区晋升到老年代(O)
- 部分可复制到新的幸存区

- 部分可复制到新的幸存区
3)Young Collection + CM(并发标记)
- 在 Young GC 时会进行 GC Root 的初始标记
- 老年代占用堆空间比例达到阈值时,进行
并发标记CM(不会 STW),由下面的 JVM 参数决定 -XX:InitiatingHeapOccupancyPercent=percent(默认45%)
4)Mixed Collection
会对 E、S、O 进行全面垃圾回收
最终标记(Remark)会 STW
拷贝存活(Evacuation)会 STW
-XX:MaxGCPauseMillis=ms部分老年代会回收到
新的老年代区域- 根据暂停时间
- 回收最多的 老年代
copy算法
新生代未达到阈值放入
新的新生代- 达到阈值的放入
老年代
- 达到阈值的放入
5) Full GC
- SerialGC
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足发生的垃圾收集 - full gc
- ParallelGC
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足发生的垃圾收集 - full gc
- CMS
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足
- G1
- 新生代内存不足发生的垃圾收集 - minor gc
- 老年代内存不足
- CM + 混合
- 回收速度跟不上:full gc
6) Young Collection 跨代引用
新生代回收的跨代引用(老年代引用新生代)问题
对老年代划分为多个
512kb卡- 弱引用了eden, 则标记为
脏卡 - 每次GC Root扫描则只管脏卡

- 弱引用了eden, 则标记为
卡表与
Remembered Set- 新生代有
Remembered Set,记录哪些引用了自己
- 新生代有
在引用变更时通过
post-write barrier+dirty card queue- 开线程异步更改卡表
concurrent refinement threads更新Remembered Set
7) Remark(重新标记)
pre-write barrier + satb_mark_queue写屏障+队列- 黑色:处理完 (不是垃圾)
- 灰色:处理中
- 白色:没处理 (垃圾)

remark

加入队列

8) JDK 8u20 字符串去重
- 优点:节省大量内存
- 缺点:略微多占用了 cpu 时间,新生代回收时间略微增加
-XX:+UseStringDeduplicatio
1 | String s1 = new String("hello"); // char[{'h','e','l','l','o'} |
- 将所有新分配的字符串放入一个队列
- 当新生代回收时,G1并发检查是否有字符串重复
- 如果它们值一样,让它们引用同一个 char[]
- 注意,与
String.intern()不一样String.intern()关注的是字符串对象- 而字符串去重关注的是 char[]
- 在JVM 内部,使用了不同的字符串表
9) JDK 8u40 并发标记类卸载
- 所有对象都经过并发标记后,就能知道哪些类不再被使用,当一个类加载器的所有类都不再使用,则卸 载它所加载的所有类
-XX:+ClassUnloadingWithConcurrentMark默认启用
10) JDK 8u60 回收巨型对象
- 一个对象大于 region 的一半时,称之为巨型对象
- G1 不会对巨型对象进行拷贝
- 回收时被优先考虑
- G1 会跟踪老年代所有
incoming引用,这样老年代incoming引用为0 的巨型对象就可以在新生 代垃圾回收时处理掉- 理解:入度为0时回收

- 理解:入度为0时回收
11) JDK 9 并发标记起始时间的调整
- 并发标记必须在堆空间占满前完成,否则退化为 FullGC
- JDK 9 之前需要使用
-XX:InitiatingHeapOccupancyPercent - JDK 9 可以动态调整
-XX:InitiatingHeapOccupancyPercent用来设置初始值- 进行数据采样并动态调整
- 总会添加一个安全的空档空间
12) JDK 9 更高效的回收
- 250+增强
- 180+bug修复
- https://docs.oracle.com/en/java/javase/12/gctuning/
5. 垃圾回收调优
- 预备知识
- 掌握 GC 相关的 VM 参数,会基本的空间调整
- 掌握相关工具
- 明白一点:调优跟应用、环境有关,没有放之四海而皆准的法则
5.1 调优领域
- 内存
- 锁竞争
- cpu
- 占用 io
5.2 确定目标
- 【低延迟】还是【高吞吐量】,选择合适的回收器
- CMS,G1,ZGC (低延迟)
- ParallelGC (高吞吐)
- Zing
5.3 最快的 GC是不发生 GC
- 查看 FullGC 前后的内存占用,考虑下面几个问题
- 数据是不是太多?
- resultSet = statement.executeQuery(“select * from 大表 limit n”)
select * from 大表加载所有数据到内存
- 数据表示是否太臃肿?
- 对象图
- 对象大小 16; Integer 24; int 4
- 是否存在内存泄漏?
- static Map map =
- 软
- 弱
- 第三方缓存实现
- 数据是不是太多?
5.4 新生代调优
新生代的特点
- 所有的 new 操作的内存分配非常廉价
- TLAB
thread-local allocation buffer线程局部的
- TLAB
- 死亡对象的回收代价是零 (死亡对象内存为0,
复制算法代价0) - 大部分对象用过即死
- Minor GC 的时间远远低于 Full GC
- 所有的 new 操作的内存分配非常廉价
越大越好吗?
-XmnSets the initial and maximum size (in bytes) of the heap for the young generation (nursery). GC is performed in this region more often than in other regions. If the size for the young generation is too small, then a lot of minor garbage collections are performed. If the size is too large, then only full garbage collections are performed, which can take a long time to complete. Oracle recommends that you keep the size for the young generation greater than 25% and less than 50% of the overall heap size
设置年轻代( nursery)的初始和最大大小(以字节为单位)。垃圾回收在这个区域比在其他区域进行得更频繁。如果年轻代的大小太小,就会进行很多次 Minor GC。如果大小太大,就只会进行 Full GC,这可能会花费很长时间完成。Oracle 建议年
轻代的大小保持在总堆大小的 25% 到 50% 之间。新生代能容纳所有
【并发量 * (请求-响应)】的数据幸存区大到能保留
【当前活跃对象+需要晋升对象】晋升阈值配置得当,让长时间存活对象尽快晋升
-XX:MaxTenuringThreshold=threshold晋升阈值-XX:+PrintTenuringDistribution
1 | Desired survivor size 48286924 bytes, new threshold 10 (max 10) |
5.5 老年代调优
以 CMS 为例
- CMS 的老年代内存越大越好
- 先尝试不做调优,如果没有 Full GC 那么已经…,否则先尝试调优新生代
- 观察发生 Full GC 时老年代内存占用,将老年代内存预设调大 1/4 ~ 1/3
-XX:CMSInitiatingOccupancyFraction=percent- 老年代占比percent时发生回收
5.6 案例
- 案例1: Full GC 和 Minor GC频繁
- 适当增大新生代
- 增大晋升阈值
- 案例2 请求高峰期发生 Full GC,单次暂停时间特别长 (CMS)
- 查看GC日志
- 查看哪个阶段时间长(初始标记,并发标记,重新标记,并发清理)
- 一般是重新标记时间长
- 使用
-XX:+CMSScavengeBeforeRemark重新标记前清理新生代
- 案例3 老年代充裕情况下,发生 Full GC (CMS jdk1.7)

















