Java线程池

基本概念

  1. 任务: 就是你自己实现的任务逻辑,一般为Runnable实现类或Callable实现类,不过在线程池中已经被封装成一个FutureTask. 在我们向线程池中提交一个任务的时候,会先判断目前线程池中的workerCount是否小于核心线程数,如果小于则将这个任务封装成一个Worker,然后启动一个新线程;如果不小于则将这个任务添加到工作队列
  2. 工作队列: 工作队列BlockQueue的实现类,它的作用就是用来缓存任务的,因为它本身是线程安全的,所以在向工作队列的时候不需要格外处理线程安全问题
  3. Worker: 可以认为每个Worker对应一个线程,在我们创建Worker的时候,会传入一个任务,这个任务就是这个Worker首次要执行的逻辑,执行完之后它就会去工作队列拿任务执行. 所有的Worker都保存在一个HashSet数据结构中,所以在向HashSet添加Worker的时候需要去处理线程安全问题,线程池中是通过ReentrantLock来保证线程安全

工作流程

其实在说这个之前我们可以先考虑一下线程池出现的目的: 因为创建线程需要比较大的开销,并且线程数太多的情况下上下文切换比较频繁,所以我们希望有一种机制来改善它,这就是线程池,改善的核心就是控制线程的数量,通过暴露接口,可以满足用户创建不同场景下的线程池

  1. 来任务了,先创建几个线程 核心线程数
  2. 任务太多了,处理不过来,总不能一直创建线程吧,这时候就将任务缓存到 工作队列
  3. 任务实在是太多,工作队列都满了,那就再创建几个线程吧 最大线程数
  4. 任务真的真的太多了,还是处理不过来,拒绝吧,提供了几种 拒绝策略
  5. 其他: 一段时间后,任务太少了,那些一直不工作的线程怎么处理? 空闲时间

使用示例

ExecutorService executorService = new ThreadPoolExecutor(
        1,
        1,
        3,
        TimeUnit.SECONDS,
        new ArrayBlockingQueue<>(2),
        (r) -> new Thread(r),
        (r, executor) -> System.out.println("拒绝"));

for (int i = 0; i < 5; i++) {
    executorService.submit(() -> {
        System.out.println(Thread.currentThread().getName());
        sleep(TimeUnit.MILLISECONDS, 50);
    });
}


----------------------------------------------执行结果----------------------------------------------
拒绝
拒绝
Thread-0
Thread-0
Thread-0

ThreadPoolExecutor

线程池的核心实现类,基于ThreadPoolExecutor可以实现满足不同场景的线程池

  1. acl: 类型为AtomicInteger,该变量包括两部分内容: 低29位用于表示workerCount,即线程池中的线程数,高3位用于表示线程池的状态,即RUNNING SHUTDOWN STOP TIDYING TERMINATED
  2. 状态之间的转换
RUNNING -> SHUTDOWN
   On invocation of shutdown(), perhaps implicitly in finalize()
(RUNNING or SHUTDOWN) -> STOP
   On invocation of shutdownNow()
SHUTDOWN -> TIDYING
   When both queue and pool are empty
STOP -> TIDYING
   When pool is empty
TIDYING -> TERMINATED
   When the terminated() hook method has completed

构造函数

public ThreadPoolExecutor(int corePoolSize,
                            int maximumPoolSize,
                            long keepAliveTime,
                            TimeUnit unit,
                            BlockingQueue<Runnable> workQueue,
                            ThreadFactory threadFactory,
                            RejectedExecutionHandler handler) {
    if (workQueue == null || threadFactory == null || handler == null)
        throw new NullPointerException();
    this.acc = System.getSecurityManager() == null ?null : AccessController.getContext();
    this.corePoolSize = corePoolSize;
    this.maximumPoolSize = maximumPoolSize;
    this.workQueue = workQueue;
    this.keepAliveTime = unit.toNanos(keepAliveTime);
    this.threadFactory = threadFactory;
    this.handler = handler;
}
  1. corePoolSize: 核心线程数,提交一个任务时,如果线程池中的线程数没有达到核心线程数,则会创建一个新的线程
  2. maximumPoolSize: 最大线程池,工作队列满了的情况下,如果线程池中的线程数没有达到最大线程数,则会创建一个新线程,否则使用拒绝策略
  3. keepAliveTime: 空闲线程存活时间,工作对立中没有任务时,线程最大等待时间,其实就是工作队列的带时间阻塞
  4. workQueue: 工作队列,存放任务的
  5. threadFactory: 创建线程工厂类
  6. handler: 线程池满了情况下,提交任务时对应的拒绝策略,可以自己实现,默认提供了几种

提交任务

// AbstractExecutorService#submit
public Future<?> submit(Runnable task) {
    if (task == null) throw new NullPointerException();
    // 创建一个FutureTask对象
    RunnableFuture<Void> ftask = newTaskFor(task, null);
    // 执行 ThreadPoolExecutor#execute
    execute(ftask);
    return ftask;
}
  1. 基于Runnable创建一个FutureTask对象,这样可以获取返回值了,因为Runnable没有返回值,所以这里直接传null
  2. 调用ThreadPoolExecutor#execute方法
ThreadPoolExecutor#execute
public void execute(Runnable command) {
    if (command == null)
        throw new NullPointerException();
    /*
        * Proceed in 3 steps:
        *
        * 1. If fewer than corePoolSize threads are running, try to
        * start a new thread with the given command as its first
        * task.  The call to addWorker atomically checks runState and
        * workerCount, and so prevents false alarms that would add
        * threads when it shouldn't, by returning false.
        *
        * 2. If a task can be successfully queued, then we still need
        * to double-check whether we should have added a thread
        * (because existing ones died since last checking) or that
        * the pool shut down since entry into this method. So we
        * recheck state and if necessary roll back the enqueuing if
        * stopped, or start a new thread if there are none.
        *
        * 3. If we cannot queue task, then we try to add a new
        * thread.  If it fails, we know we are shut down or saturated
        * and so reject the task.
        */

    int c = ctl.get();
    // 如果`workerCount < corePoolSize`,则尝试创建一个新线程,创建成功就直接返回,失败继续下面的流程
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    
    // 如果线程池正在运行并且将该任务添加到工作队列成功
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        // 再次检查线程池是否正在运行,如果不在运行了就将该任务移除并执行拒绝策略
        if (! isRunning(recheck) && remove(command))
            reject(command);
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }

    // 如果`workerCount >= corePoolSize && 工作队列放不下了`,再次尝试添加一个新线程,如果添加失败则执行拒绝策略
    else if (!addWorker(command, false))
        reject(command);
}
  1. 如果workerCount < corePoolSize,则尝试创建一个新线程,创建成功就直接返回,失败继续下面的流程
  2. workerCount >= corePoolSize,再次检查线程池是否正在运行,如果不在运行了就将该任务移除并执行拒绝策略
  3. 如果workerCount >= corePoolSize && 工作队列放不下了,再次尝试添加一个新线程,如果添加失败则执行拒绝策略
ThreadPoolExecutor#addWorker

该方法用于尝试向线程池中添加一个新的线程,如果线程池运行状态不正常,则会添加失败


1. `firstTask`: 任务的具体逻辑,这里是一个`FutureTask`对象
2. `core`: 如果为true,这和`corePoolSize`比较,否则和`maximumPoolSize`比较. 因为执行`addWorker`方法只有两种情况:一种是`workerCount<corePoolSize`;一种是工作队列已满,这时需要和`maximumPoolSize`比较
private boolean addWorker(Runnable firstTask, boolean core) {
    retry:
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

        // Check if queue empty only if necessary.  仅在必要时检查队列是否为空, 状态 第二个括号里的条件估计和SHUTDOWN语义有关,后面再看吧
        if (rs >= SHUTDOWN &&
            ! (rs == SHUTDOWN &&
                firstTask == null &&
                ! workQueue.isEmpty()))
            return false;

        // 通过自旋操作更新`workerCount`的值,即:加1
        for (;;) {
            // 获取目前线程池中的线程数
            int wc = workerCountOf(c);

            // 因为执行`addWorker`方法只有两种情况:一种是`workerCount<corePoolSize`,这时需要和`corePoolSize`比较; 一种是工作队列已满,这时需要和`maximumPoolSize`比较
            if (wc >= CAPACITY || wc >= (core ? corePoolSize : maximumPoolSize))
                return false;

            // 通过CAS操作尝试对`workerCount`加1,如果成功就跳出最外层循环
            if (compareAndIncrementWorkerCount(c))
                break retry;

            c = ctl.get();  // Re-read ctl

            // 如果在自旋(内循环更新`workerCount`值)期间,线程池的状态发生变化,重新进入外循环
            if (runStateOf(c) != rs)
                continue retry;
            // else CAS failed due to workerCount change; retry inner loop
        }
    }

    boolean workerStarted = false;
    boolean workerAdded = false;
    Worker w = null;
    try {
        w = new Worker(firstTask);
        final Thread t = w.thread;
        if (t != null) {
            // 这里的`ReentrantLock`主要作用是保证添加`Worker`到`workers`时是线程安全的,因为`workers`是`HashSet`结构,其本身不是线程安全的
            final ReentrantLock mainLock = this.mainLock;
            mainLock.lock();
            try {
                // Recheck while holding lock.
                // Back out on ThreadFactory failure or if
                // shut down before lock acquired.
                int rs = runStateOf(ctl.get());

                // 如果线程池正在运行
                if (rs < SHUTDOWN || (rs == SHUTDOWN && firstTask == null)) {
                    // 如果t.isAlive()这说明线程已经被启动了,这时候直接抛异常,一般不会出现 
                    if (t.isAlive()) // precheck that t is startable
                        throw new fIllegalThreadStateException();

                    // 将该任务添加到`workers`中,`workers`是一个`HashSet`结构,不过这里通过`ReentrantLock`保证它是线程安全的
                    workers.add(w);

                    int s = workers.size();
                    // 更新`largestPoolSize`,该值用于表示线程池中曾经达到的最大线程数
                    if (s > largestPoolSize)
                        largestPoolSize = s;

                    workerAdded = true;
                }
            } finally {
                mainLock.unlock();
            }
            if (workerAdded) {
                // 最后启动线程
                t.start();
                workerStarted = true;
            }
        }
    } finally {
        // 根据上面的代码来判断,如果线程池运行状态不正常的时候,会添加`Worker`失败,然后执行`addWorkerFailed`方法
        if (! workerStarted)
            addWorkerFailed(w);
    }
    return workerStarted;
}

注释已经写的很详细了,总结一下:

  1. 先通过自旋更新workerCount的值
  2. 添加Workerworkers中时需要通过ReentrantLock保证线程安全,因为workersHashSet结构,其本身不是线程安全的
  3. 线程池运行状态不正常时,会添加Worker失败,此时需要执行ThreadPoolExecutor#addWorkerFailed方法
ThreadPoolExecutor#addWorkerFailed

执行到这里,说明线程池可能已经出现了问题,这时候需要回滚之气那的操作.即恢复workerCount的值,然后将该Workerworkers中移除,并尝试停止线程池

private void addWorkerFailed(Worker w) {
    final ReentrantLock mainLock = this.mainLock;
    mainLock.lock();
    try {
        if (w != null)
            // 从`HashSet`中移除
            workers.remove(w);
        // 对`workerCount`减1
        decrementWorkerCount();
        // 尝试停止线程池
        tryTerminate();
    } finally {
        mainLock.unlock();
    }
}
  1. HashSet中移除刚刚添加的Worker
  2. workerCount减1
  3. 尝试停止线程池

执行任务

通过上面的代码可以发现,提交任务的时候,如果创建了一个新的Worker实例,就相当于创建了一个新的线程,并且会启动该线程. 那线程启动之后主要做了什么?
Thread#start => Worker#run => ThreadPoolExecutor#runWorker

Worker
  1. 实现了Runnable接口,因此当线程启动之后,就会执行Worker#run方法
  2. 继承自AbstractQueuedSynchronizer,说明它具有锁的功能,但它是不可重入锁
  3. 在构造函数中,已自己为参数,创建一个线程,并将该线程作为自己的一个属性thread
Worker(Runnable firstTask) {
    // 设置state=-1,则无法获取锁, 在runWorker中会先执行unlock方法,然后再执行lock方法获取锁
    setState(-1); // inhibit interrupts until runWorker
    // 最开始执行的那个任务,之后的任务去队列里面拿
    this.firstTask = firstTask;
    // 以自己为参数创建一个线程
    this.thread = getThreadFactory().newThread(this);
}

Worker#run方法中,直接调用了ThreadPoolExecutor#runWorker方法

ThreadPoolExecutor#runWorker
final void runWorker(Worker w) {
    Thread wt = Thread.currentThread();
    // 先取第一个任务执行,这是在构造函数中传入的
    Runnable task = w.firstTask;
    w.firstTask = null;

    // 因为在Worker构造函数中默认设置了state为-1,需要先执行`Worker#unlock`将state设置为0
    w.unlock(); // allow interrupts
    boolean completedAbruptly = true;
    try {
        // 如果首个任务不为null并且工作队列里面还有任务
        while (task != null || (task = getTask()) != null) {
            w.lock();

            // If pool is stopping, ensure thread is interrupted;
            // if not, ensure thread is not interrupted.  This
            // requires a recheck in second case to deal with
            // shutdownNow race while clearing interrupt
            // 有点不太懂
            if ((runStateAtLeast(ctl.get(), STOP) || (Thread.interrupted() && runStateAtLeast(ctl.get(), STOP))) && !wt.isInterrupted())
                wt.interrupt();

            try {
                // 前置处理,默认为空
                beforeExecute(wt, task);

                Throwable thrown = null;
                try {
                    // 执行任务
                    task.run();
                } catch (RuntimeException x) {
                    thrown = x; throw x;
                } catch (Error x) {
                    thrown = x; throw x;
                } catch (Throwable x) {
                    thrown = x; throw new Error(x);
                } finally {
                    // 后置处理,默认为空
                    afterExecute(task, thrown);
                }
            } finally {
                // 设置task为null, 用于取下一个任务
                task = null;
                // 完成任务数加1
                w.completedTasks++;
                w.unlock();
            }
        }

        // 工作队列里面没任务了,并且在获取任务时在工作队列上阻塞的时候大于空闲时间,并且时正常结束的,即没有发生什么异常
        completedAbruptly = false;
    } finally {
        // 将该Worker从HashSet中移除,执行一些销毁操作
        processWorkerExit(w, completedAbruptly);
    }
}
  1. 先执行firstTask,该任务在创建Worker时传入
  2. 再从工作队列中取任务执行
  3. 执行完成之后,说明runWorker将要退出了,这时候同时需要将该Worker从HashSet中移除

todo 最核心的,中断处理,即那个判断条件,也就是Worker实现AQS的目的

空闲线程清理

在创建线程池的时候,有提到一个参数:空闲时间,这个空闲时间是什么意思呢?
Worker执行完firstTask之后,就会去工作队列中拿任务继续执行,工作队列是一个阻塞队列,当工作队列中没有任务时,线程就会阻塞,直到有提交了新的任务. 这个空闲时间其实就可以理解成该线程的阻塞时间,这部分逻辑在ThreadPoolExecutor#getTask方法中

private Runnable getTask() {
    boolean timedOut = false; // Did the last poll() time out?
    for (;;) {
        int c = ctl.get();
        int rs = runStateOf(c);

        // Check if queue empty only if necessary.
        if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
            decrementWorkerCount();
            return null;
        }

        int wc = workerCountOf(c);

        // Are workers subject to culling?
        // allowCoreThreadTimeOut表示线程是否永久存货, 默认是永久存活, 结合下面的代码说明在这两种情况下,空闲时间生效: 1.allowCoreThreadTimeOut==true  2.工作线程数大于corePoolSize
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

        if ((wc > maximumPoolSize || (timed && timedOut)) && (wc > 1 || workQueue.isEmpty())) {
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {
            Runnable r = timed ? workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) : workQueue.take();
            if (r != null)
                return r;
            timedOut = true;
        } catch (InterruptedException retry) {
            timedOut = false;
        }
    }
}
  1. 空闲时间其实就是线程在阻塞队列上阻塞的最大时间,即通过阻塞队列实现
  2. 在这两种情况下,空闲时间才会生效: allowCoreThreadTimeOut==true 或者 工作线程数大于corePoolSize

常见线程池

通过Executors可以快速的创建一些不同类型的线程池

ExecutorService#newSingleThreadExecutor

public static ExecutorService newSingleThreadExecutor() {
    return new FinalizableDelegatedExecutorService
        (new ThreadPoolExecutor(1, 1,
                                0L, TimeUnit.MILLISECONDS,
                                new LinkedBlockingQueue<Runnable>()));
}
  1. corePoolSize为1,maximumPoolSize为1,意味着线程池中最多只有一个工作线程
  2. 空闲时间为0,表示没任务立即销毁该线程
  3. 工作队列LinkedBlockingQueue,这其实是一个有界的阻塞队列,但是由于这里没有在创建LinkedBlockingQueue的时设置容量,所以默认为Integer.MAX_VALUE

优缺点

  1. 对阻塞队列的长度没有限制,可能会造成OOM

ExecutorService#newCachedThreadPool

public static ExecutorService newCachedThreadPool() {
    return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                    60L, TimeUnit.SECONDS,
                                    new SynchronousQueue<Runnable>());
}
  1. corePoolSize为0,maximumPoolSize为Integer.MAX_VALUE,意味着线程数可以为
    Integer.MAX_VALUE
  2. 空闲时间为60s,也就是一分钟
    3.工作队列SynchronousQueue,这是一个比较特殊的阻塞队列,当一个生产者线程向队列中存数据时,生产者线程将被阻塞直到有另一个消费者线程从队列中取数据(即take),反之亦然

优缺点

  1. 适合执行时间比较短的任务,这种情况下,很多线程可以被复用,避免每次都创建大量线程的开销
  2. 但在任务执行时间比较长的情况,由于该线程池对线程数没有限制,可能会创建非常多的线程.

ExecutorService#newFixedThreadPool

public static ExecutorService newFixedThreadPool(int nThreads) {
    return new ThreadPoolExecutor(nThreads, nThreads,
                                    0L, TimeUnit.MILLISECONDS,
                                    new LinkedBlockingQueue<Runnable>());
}
  1. corePoolSize为入参,maximumPoolSize为入参
  2. 空闲时间为0,表示没任务立即销毁该线程
  3. 工作队列LinkedBlockingQueue,这其实是一个有界的阻塞队列,但是由于这里没有在创建LinkedBlockingQueue的时设置容量,所以默认为Integer.MAX_VALUE

这个其实和newSingleThreadExecutor有点像,只不过newSingleThreadExecutor中只有一个线程,而newFixedThreadPool是固定的线程

优缺点

  1. 对阻塞队列的长度没有限制,可能会造成OOM

ExecutorService#ScheduledThreadPool

public ScheduledThreadPoolExecutor(int corePoolSize, ThreadFactory threadFactory) {
    super(corePoolSize, Integer.MAX_VALUE, 0, NANOSECONDS,new DelayedWorkQueue(),threadFactory);
}
  1. corePoolSize为入参,maximumPoolSize为Integer.MAX_VALUE
  2. 空闲时间为0,表示没任务立即销毁该线程
  3. 工作队列DelayedWorkQueue,这是一个有界的阻塞队列

优缺点

  1. 对阻塞队列的长度没有限制,可能会造成OOM

总结

还是推荐根据具体场景,基于ThreadPoolExecutor定制自己的线程池

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352