1. JVM中线程的创建流程
jvm剥离了一套公共的无关平台的线程类:Thread抽象类。Thread类声明在jdk8u-dev/hotspot/src/share/vm/runtime/thread.hpp
中。Thread有个抽象方法run()
。当创建好一个Thread实例,需要调用操作系统底层的os::create_thread
方法,传入thread对象和新线程栈大小(64位系统默认是1m,32位的是512k;CompilerThread比较特殊,分配了4m)。
在调用系统的底层函数创建好线程之后,将以java_start
函数为线程入口,Thread
对象为参数启动线程。在线程中,会调用该对象的run
方法,实现线程功能的定制。直接借用thread.hpp
中的代码注释显示继承关系。
// Class hierarchy
// - Thread
// - NamedThread
// - VMThread
// - ConcurrentGCThread
// - WorkerThread
// - GangWorker
// - GCTaskThread
// - JavaThread
// - WatcherThread
使用伪代码大概是这样。
父线程:
step1: Thread *thread = new VMThread();//for example
step2 : os::create_thread(Thread:thread ,stacksize:0);
子线程:
thread->run();
我们知道,线程是cpu调度的最小单位。可以从线程的角度,大致分析下jvm的工作内容。所以我们先初步分析下各种线程的作用。
2. JVM中的Thread子类
2.1 VMThread
VMThread可以说是最核心的线程了,一个进程中只会创建一个,继承关系:VMThread->NamedThread->Thread->ThreadShadow
,其中ThreadShadow
是一个异常相关的类。VMThread内部维护了一个任务队列,jvm通过调用VMThread的execute方法来塞入VM_Operation类型的任务。在vm线程获取到任务后,调用VM_Operation
对象的doit()
方法。下面我们看看有哪些VM_Operation
。先上我们最关心的GC任务。
VM_CMS_Operation
VM_CGC_Operation
VM_GC_Operation
重要的子类:VM_ParallelGCSystemGC,调用java代码System.gc() 或者JVMTI中会用到;VM_G1CollectFull,VM_GenCollectFull,VM_GC_HeapInspection。
VM_CGC_Operation
VM_CGC_Operation
VM_CGC_Operation
VM_CGC_Operation
VM_CGC_Operation
VM_CGC_Operation
2.2 JavaThread
用户可以通过参数-XX:ThreadStackSize=2m
或者 -Xss2m
或者 -XX:ThreadStackSize=2048
(注意千字节时不加k,我调试的时候加k直接变成2g了)将JavaThread
类型的线程的栈大小调整为2m(注意仅仅是JavaThread类型,包括用户自定的和jvm内部生成的)。但是有最小值,低于这个最小值则取系统最小值,我的机器上是160k。
2.2.1 java程序中创建的线程
我们知道,java.lang.Thread 的start方法最终是调用了start0本地方法。查看jvm的实际映射函数为jvm.cpp
中的JVM_StartThread
。实现也比较清晰,将java线程对象包装成一个entry,生成一个JavaThread
按照第一节的流程创建对象,最后在新线程中通过JavaCalls::call_virtual
方法调用Java代码中对应的线程对象run
方法,在退出时将线程状态改变成terminal。之前我还很疑惑在jdk代码中没有改变threadStatus
的地方,但是实际却可以通过这个值来判断线程的状态。原来是jvm代码中操纵的,具体的函数是java_lang_Thread::set_thread_status
。
2.2.2 jvm自建的JavaThread
2.2.2.1 CompilerThread
CompilerThread 按照功能细微不同分为C1 CompilerThread(client模式下的编译器) 和C2 CompilerThread(server模式下的编译器)。默认数量根据cpu计算,我们可以用vm参数-XX:CICompilerCount=n
来设置总的编译线程数量,其中 C1类型的占1/3。
CompilerThread中的队列实际上是CompileBroker管理的,我们可以通过调用CompileBroker::compile_method方法塞入一个方法级的编译任务。
2.3 GCTaskThread
顾名思义,GCTaskThread是用来执行gc任务的。粘贴其run方法
void GCTaskThread::run() {
// Set up the thread for stack overflow support
this->record_stack_base_and_size();
this->initialize_thread_local_storage();
// Bind yourself to your processor.
if (processor_id() != GCTaskManager::sentinel_worker()) {
if (TraceGCTaskThread) {
tty->print_cr("GCTaskThread::run: "
" binding to processor %u", processor_id());
}
if (!os::bind_to_processor(processor_id())) {
DEBUG_ONLY(
warning("Couldn't bind GCTaskThread %u to processor %u",
which(), processor_id());
)
}
}
// Part of thread setup.
// ??? Are these set up once here to make subsequent ones fast?
HandleMark hm_outer;
ResourceMark rm_outer;
TimeStamp timer;
for (;/* ever */;) {
// These are so we can flush the resources allocated in the inner loop.
HandleMark hm_inner;
ResourceMark rm_inner;
for (; /* break */; ) {
// This will block until there is a task to be gotten.
GCTask* task = manager()->get_task(which());
// Record if this is an idle task for later use.
bool is_idle_task = task->is_idle_task();
// In case the update is costly
if (PrintGCTaskTimeStamps) {
timer.update();
}
jlong entry_time = timer.ticks();
char* name = task->name();
// If this is the barrier task, it can be destroyed
// by the GC task manager once the do_it() executes.
task->do_it(manager(), which());
// Use the saved value of is_idle_task because references
// using "task" are not reliable for the barrier task.
if (!is_idle_task) {
manager()->note_completion(which());
if (PrintGCTaskTimeStamps) {
assert(_time_stamps != NULL,
"Sanity (PrintGCTaskTimeStamps set late?)");
timer.update();
GCTaskTimeStamp* time_stamp = time_stamp_at(_time_stamp_index++);
time_stamp->set_name(name);
time_stamp->set_entry_time(entry_time);
time_stamp->set_exit_time(timer.ticks());
}
} else {
// idle tasks complete outside the normal accounting
// so that a task can complete without waiting for idle tasks.
// They have to be terminated separately.
IdleGCTask::destroy((IdleGCTask*)task);
set_is_working(true);
}
// Check if we should release our inner resources.
if (manager()->should_release_resources(which())) {
manager()->note_release(which());
break;
}
}
}
}
这里引入一个GCTaskManager类,用于管理gc线程的。gc线程从GCTaskManager的任务队列SynchronizedGCTaskQueue中取一个GCTask任务,然后调用GCTask对象的do_it方法执行具体逻辑。
- GCTaskManager维护了一个GCTask任务队列,如何塞入队列?
GCTaskManager提供了两个方法入列,add_task:添加单个,实际未使用;add_list:添加多个,类外是通过execute_and_wait方法间接调用来插入。
GCTask任务有哪些?
NoopGCTask
啥也没做
- BarrierGCTask
等待其他gc工作线程空闲下来才返回do_it方法, 一个常见子类是WaitForBarrierGCTask,内部维护了monitor,实现了事后通知的功能。
- IdleGCTask
只能用于动态的gc线程,作用应该是辅助,如果是获取到的是"傻子"任务,那么可以略过。
- MarkFromRootsTask
RefProcTaskProxy
RefEnqueueTaskProxy
StealMarkingTask
StealRegionCompactionTask
UpdateDensePrefixTask
DrainStacksCompactionTask
PSRefProcTaskProxy
PSRefEnqueueTaskProxy
ScavengeRootsTask
ThreadRootsTask
StealTask
OldToYoungRootsTask