JVM中对java.lang.ref.Reference$Lock上的数组分配的大量锁定
我们使用 Java Flight Recorder 分析了我们的应用程序,并在 java.lang.ref.Reference$Lock 对象上发现了大量锁。
我调查了堆栈跟踪中的一些地方,发现在所有情况下 - 都有数组分配
代码示例(图像上的位置 3):
public static char[] copyOfRange(char[] original, int from, int to) {
int newLength = to - from;
if (newLength < 0)
throw new IllegalArgumentException(from + " > " + to);
// stacktrace points on next line
char[] copy = new char[newLength];
System.arraycopy(original, from, copy, 0,
Math.min(original.length - from, newLength));
return copy;
}
我怀疑这种锁定与 GC 有关系,但找不到任何相关信息。我在哪里可以阅读有关此主题的更多信息?
活动的最终目标:了解在这种情况下发生了什么,影响这一点的巫术因素以及我们如何减少此类操作的锁定时间。
评论中的一些细节:
- 爪哇 8
- 堆 512Mb
- GC-G1
- 通过实验我发现,锁定时间随着堆大小的增加而减少。
回答
Java Flight Recorder 的一大缺点是它只显示 Java 堆栈,完全忽略了 native 和 VM 部分。
在这个意义上,async-profiler更准确。如果在lock
分析模式下运行它并打开本机堆栈,它将显示获取这些锁在 JVM 中的确切位置。示例命令:
./profiler.sh -d 60 -e lock --cstack fp -f profile.html -o flamegraph=total PID
-d 60
运行分析 60 秒-e lock
配置文件锁争用--cstack fp
记录 C(本机)堆栈-f profile.html
输出文件名(async-profiler 2.0 中的 HTML 格式,或 1.x 中的 SVG)-o flamegraph=total
使用总锁等待时间作为计数器构建火焰图PID
Java 进程 ID
在此示例中,火焰图突出显示了Reference$Lock
实例上的锁争用。堆栈跟踪的 Java 部分以绿色显示。这与您在 JFR 中看到的堆栈跟踪相匹配。与您的情况一样,顶部 Java 框架是Arrays.copyOfRange
(该图还显示了其他堆栈,但让我们关注第一个堆栈)。
黄色部分是原生 C++ 代码。让我解释一下那里发生了什么。
-
Arrays.copyOfRange
调用 VM 运行时函数OptoRuntime::new_array_nozero_C
。实际的数组分配发生在 JVM 的 C++ 代码中。 -
JVM 无法从现有线程本地分配缓冲区 (TLAB) 分配数组,然后回退到新 TLAB 的慢速路径分配。
-
慢路径分配也不会成功,因为 Java Heap 中没有足够的空闲内存。因此,JVM 同步调用垃圾收集器。
-
在 GC 序言中,JVM 尝试获取保护挂起引用列表的锁。这是为了确保
ReferenceHandler
线程在 GC 开始之前离开临界区。在持有此锁的同时,JVM 可以安全地将新发现的弱引用附加到挂起列表。 -
但是,该锁已被另一个线程获取,该线程同时尝试以相同的方式调用垃圾收集器。当前线程被挂起直到 GC 完成。
综上所述,多个Java线程同时尝试从Heap中分配一个对象,但Heap已满。因此,垃圾收集开始,分配线程被阻塞Reference$Lock
- 引用挂起列表锁。
争论Reference$Lock
本身不是问题。分配线程无论如何都不能继续,直到 GC 回收足够的内存。实际问题是并发垃圾收集跟不上分配率。
要缓解此问题,请尝试以下一种或多种方法:
- 增加堆大小;
- 降低分配率;
- 增加并发 GC 线程的数量 -
ConcGCThreads
; - 降低
InitiatingHeapOccupancyPercent
以提前启动并发 GC 周期;
增加堆可能是最有效的。
顺便说一句,async-profiler 还有其他有用的模式来诊断 GC 相关问题:
-e cpu
显示占用最多 CPU 时间的内容。Java 和 VM 线程一起显示在同一图表上,因此您可以了解与应用程序工作相比,GC 活动是否太高。-e alloc
显示分配最多的代码。在研究如何降低分配率时,它特别有用。