# JVM调优理论知识

# 什么是垃圾回收

垃圾回收(Garbage Collection,GC)是追踪所有正在被使用的对象,并标注剩余的为垃圾。

# C++ VS Java

C++使用时需要手动分配需要的空闲内存, 但是如果用完后忘了 free 掉这些内存,则之后也无法再次使用这部分内存。这部分内存是属于被声明但未被继续使用。这种情况称为一个内存泄漏(memory leak)

Java会自动回收未被用的内存,减少人本身可能犯错的可能性。这种自动的机制就是垃圾回收**(简称GC)**

# 垃圾确定算法

# 引用计数算法

引用计数算法(Reference count)就是在每个对象在创建的时候,就给这个对象绑定一个计数器。

每当有一个引用指向该对象时,计数器加一;

每当有一个指向它的引用被删除时,计数器减一。

这样,当没有引用指向该对象时,该对象死亡,计数器为0,这时就应该对这个对象进行垃圾回收操作。

1287132-20181128210919939-1689476047

# 优点

  • 简单

  • 计算代价分散

  • 幽灵时间短

    幽灵时间指对象死亡到回收的这段时间,处于幽灵状态

# 缺点

  • 不全面

    容易漏掉循环引用的对象, 如上图的红色部分就是循环引用

  • 并发支持较弱

  • 占用额外内存空间

# 根可达算法

Root Searching

线程栈变量, 静态变量, 常量池, JNI指针都可以称为根对象.

1287132-20181128211003676-1398160044

为了解决引用计数法的循环引用问题,Java 使用了可达性分析的方法。通过一系列的"GC roots"对象作为起点搜索。如果在"GC roots"和一个对象之间没有可达路径,则称该对象是不可达的。

需要注意的是,不可达对象不等价于可回收对象,不可达对象变为可回收对象至少要经过两次标记过程。两次标记后仍然是可回收对象,则将面临回收。

# 垃圾清理算法

# 复制算法

  • 适合存活对象比较少的情况
  • 不会产生碎片
  • 扫描一次
  • 需要移动对象
  • 内存减半

img

复制算法(Copying) 是为了解决 Mark-Sweep 算法内存碎片化的缺陷而被提出的算法。按内存容量将内存划分为等大小的两块每次只使用其中一块,当这一块内存满后将尚存活的对象复制到另一块上去,把已使用的内存清掉.

这种算法虽然实现简单,内存效率高,不易产生碎片,但是最大的问题是可用内存被压缩到了原本的一半。且存活对象增多的话,Copying 算法的效率会大大降低。

# 标记清除算法

  • 适合存活对象比较多的情况,
  • 容易产生碎片
  • 需要扫描两次
  • 不需要移动对象

image-20201112210616568

标记清除算法(Mark-Sweep)是最基础的垃圾回收算法,分为两个阶段,标注和清除。标记阶段标记出所有需要回收的对象,清除阶段回收被标记的对象所占用的空间。所以标记清除法每次清除都需要遍历两边内存.

从图中我们就可以发现,该算法最大的问题是内存碎片化严重,后续可能发生大对象不能找到可利用空间的问题。

# 标记整理算法

  • 不会产生碎片
  • 扫描两次
  • 需要移动对象

标记整理算法(Mark-Compact)

img

结合了以上两个(复制算法/标记清除算法)算法,为了避免缺陷而提出。标记阶段和Mark-Sweep 算法相同,标记后不是清理对象,而是将存活对象移向内存的一端。然后清除端边界外的对象。

# JVM内存分代模型

JVM内存分代模型, 用于分代垃圾回收算法

  1. 部分垃圾回收器使用的模型

    除Epsilon ZGC Shenandoah之外的GC都是使用逻辑分代模型

    G1是逻辑分代,物理不分代

    除此之外不仅逻辑分代,而且物理分代

  2. 新生代 + 老年代 + 永久代(1.7)Perm Generation/ 元数据区(1.8) Metaspace

    1. 永久代 元数据 - Class
    2. 永久代必须指定大小限制 ,元数据可以设置,也可以不设置,无上限(受限于物理内存)
    3. 字符串常量 1.7 - 永久代,1.8 - 堆
    4. MethodArea逻辑概念 - 永久代、元数据
  3. 新生代 = Eden + 2个suvivor区

    1. YGC回收之后,大多数的对象会被回收,活着的进入s0
    2. 再次YGC,活着的对象eden + s0 -> s1
    3. 再次YGC,eden + s1 -> s0
    4. 年龄足够 -> 老年代 (15 CMS 6)
    5. s区装不下 -> 老年代
  4. 老年代

    1. 顽固分子
    2. 老年代满了FGC Full GC
  5. GC Tuning (Generation)

    image-20201112010000330

    1. 尽量减少 FGC
    2. MinorGC = YGC 调整 -Xmn 参数可以影响 GC 回收
    3. MajorGC = FGC 调整 -Xms-Xmx 参数可以影响 GC 回收
  6. 对象分配过程图 image-20201112222743054

  7. 动态年龄:(不重要) https://www.jianshu.com/p/989d3b06a49d

  8. 分配担保:(不重要) YGC期间 survivor区空间不够了 空间担保直接进入老年代 参考:https://cloud.tencent.com/developer/article/1082730

# 各代使用的算法

# 分代收集算法

分代收集法是目前大部分JVM 所采用的方法,其核心思想是根据对象存活的不同生命周期将内存划分为不同的域,一般情况下将GC 堆划分为老生代(Tenured/Old Generation)和新生代(Young Generation)。

老生代的特点是每次垃圾回收时只有少量对象需要被回收;

新生代的特点是每次垃圾回收时都有大量垃圾需要被回收,因此可以根据不同区域选择不同的算法

# 新生代复制算法

目前大部分JVM的GC 对于新生代都采取Copying 算法

因为新生代中每次垃圾回收都要回收大部分对象,即要复制的操作比较少,但通常并不是按照1 : 1 来划分新生代。

一般将新生代划分为一块较大的Eden 空间和两个较小的Survivor 空间(From Space, To Space),每次使用Eden 空间和其中的一块Survivor 空间,当进行回收时,将该两块空间中还存活的对象复制到另一块Survivor 空间中。

img

# 老年代与标记复制算法

image-20201112212954234

老年代因为每次只回收少量对象,因而采用 Mark-Compact 算法。

JAVA 虚拟机提到过的处于方法区的永生代(Permanet Generation),它用来存储 class 类,常量,方法描述等。

对永生代的回收主要包括废弃常量和无用的类。

对象的内存分配主要在新生代的Eden Space 和Survivor Space 的From Space(Survivor 目前存放对象的那一块),少数情况会直接分配到老生代。当新生代的Eden Space 和From Space 空间不足时就会发生一次GC,进行GC 后,Eden Space 和From Space 区的存活对象会被挪到To Space,然后将Eden Space 和From Space 进行清理。如果To Space 无法足够存储某个对象,则将这个对象存储到老生代。在进行GC 后,使用的便是Eden Space 和To Space 了,如此反复循环。

当对象在Survivor 区躲过一次GC 后,其年龄就会+1。默认情况下年龄到达15 的对象会被移到老生代中。

上次更新时间: 2020/11/17 上午12:35:40