Java 线程池实现原理

概述

现在机器基本都是多核的，开启多线程可以有效地增加系统的吞吐量和性能，如下是开启一个线程最简单的方式

new Thread(new Runnable() {
    @Override
    public void run() {
        // do something
    }
}).start();

这个线程使用完后，就会被系统所回收。线程虽是轻量级的，但其创建、关闭依然需要花费时间、资源。当任务粒度不大的时候，大量创建线程会得不偿失。而且当线程数超过核心数，创建后的线程还会处于等待状态。

因此线程的数量最好是能控制的，且能够复用，线程池即能满足需求。下面看看创建一个线程池，并提交一个任务去执行的方式

ExecutorService executorService = Executors.newSingleThreadExecutor();
executorService.execute(new Runnable() {
    @Override
    public void run() {
        // do something
    }
});

实现原理

上面创建了一个只拥有一个线程的线程池，并提交一个任务去执行。线程池的创建可以使用线程池工厂 Executors 里面的 new... 系列方法，含义如下

Executors.newSingleThreadExecutor(); // 创建一个只有单个线程的线程池。任务提交后，若这个线程空闲，则执行，否则加入队列，待线程空闲后执行
Executors.newFixedThreadPool(numbersOfThread); // 创建一个有numbersOfThread个线程的线程池。任务提交后，若有空闲线程，则执行，否则加入队列，待有线程空闲后执行
Executors.newCachedThreadPool(); // 创建一个有无限个线程的线程池。任务提交后，若有空闲线程，则执行，否则创建新的线程去执行
Executors.newSingleThreadScheduledExecutor(); // 在newSingleThreadExecutor之上扩展了在给定时间执行某任务的功能
...

查看线程工厂 Executors new... 方法的实现，我们可以看到最终都是调用了 ThreadPoolExecutor 的构造方法

public ThreadPoolExecutor(int corePoolSize, // 核心线程数量
                          int maximumPoolSize, // 最大线程数量
                          long keepAliveTime, // 当线程数量超过核心线程数量时，其余线程保活时间
                          TimeUnit unit, // 时间单位
                          BlockingQueue<Runnable> workQueue, // 任务队列
                          ThreadFactory threadFactory, // 线程工厂
                          RejectedExecutionHandler handler // 任务提交失败时的执行策略
)

这里先说下任务提交后，线程池的执行策略

(1) 当线程池的实际线程数量小于corePoolSize时，则优先创建核心线程；
(2) 若大于等于corePooSize，则将新的任务加入等待队列；
(3) 若加入队列失败，并且线程数小于maximumPoolSize，则创建新的线程执行任务；
(4) 否则执行拒绝策略。

下面我们看看具体的源码

    public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        int c = ctl.get();
        if (workerCountOf(c) < corePoolSize) { // workerCountOf：当前线程总数
            if (addWorker(command, true)) // 创建一个核心线程并执行当前提交任务
                return;
            c = ctl.get();
        }
        if (isRunning(c) && workQueue.offer(command)) { // 把任务加到任务队列里面
            int recheck = ctl.get();
            if (! isRunning(recheck) && remove(command))
                reject(command);
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        else if (!addWorker(command, false)) // 创建一个非核心线程并执行任务
            reject(command);
    }

接下来我们看看 Worker 工作线程的执行过程

    private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable // 实现了Runnable接口
    {

        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;
            this.thread = getThreadFactory().newThread(this); // 用一开始设置的线程工厂创建了线程，addWorker之后会调用这个线程的start方法启动线程
        }

        public void run() {
            runWorker(this); // 执行工作线程
        }

        final void runWorker(Worker w) {
            try {
                while (task != null || (task = getTask()) != null) { // 如果当前任务未执行，则先执行当前任务；否则去任务队列里面拿任务执行，拿不到任务时，这个线程就退出了
                    ...
                    try {
                        beforeExecute(wt, task); //任务执行前的回调
                        Throwable thrown = null;
                        try {
                            task.run(); // 任务执行
                        } finally {
                            afterExecute(task, thrown); // 任务执行完的回掉
                        }
                    } finally {
                        task = null;
                        w.completedTasks++;
                        w.unlock();
                    }
                }
                completedAbruptly = false;
            } finally {
                processWorkerExit(w, completedAbruptly);
            }
        }

接下来看看 getTask() 获取任务的过程

    private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
            int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc > corePoolSize; // 要等待 or 阻塞

            try {
                Runnable r = timed ?
                    // 从队列里面拿任务，如果队列为空，最长等待时间为 keepAliveTime
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) : 
                    // 从队列里面拿任务，如果队列为空，则阻塞，直到队列有新任务添加为止
                    workQueue.take(); 
                    // 所以线程池的核心线程为什么不会销毁、
                    // 非核心线程为什么能存活 keepAliveTime 时间，
                    // 超时后会被回收，是不是豁然开朗了？
                if (r != null)
                    return r;
                timedOut = true;
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

可以看到，线程池实现的相关特性，主要是通过 getTask() 时从任务队列里面拿任务的等待阻塞来实现的

至于线程工厂，这里不再赘述。

下面最后再看看拒绝策略的种类

(1) AbortPolicy：直接抛异，阻止系统正常工作
(2) CallerRunsPolicy：只要线程池未关闭，直接在调用者线程执行当前任务
(3) DiscardOledesPolicy：丢弃最老的请求，尝试重新提交任务
(4) DiscardPolicy：默默丢弃当前提交的任务
或者可以自己实现RejectedExecutionHandler接口

至此，线程池的大体实现基本就清晰了

Java 线程池实现原理