线程
在操作系统中,线程一般是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务,在Java中线程能力由Thread
类实现,其使用过程也十分简单只需三步即可。
1、将需要单独执行的代码放在一个类的run
方法中,这个类需要实现Runnable
接口:
class WorkTask implements Runnable {
@Override
public void run() {
// doSomething...
}
}
WorkTask workTask = new WorkTask();
如果使用的是Java8及以上版本,也可以直接使用lambda表达式创建:
Runnable workTask = () -> {
// doSomething
};
2、使用创建的Runnadble
对象构造Thread
对象
Thread workThread = new Thread(workTask);
3、启动线程
workThread.start();
另外,由于Thread
类本身实现了Runnable
接口,所以我们也可以直接集成Thread
类然后复写它的run
方法来定义线程,需要注意的是,不管通过哪种方式创建线程,如果要启动它,都必须调用start()
方法,不能直接调用run
方法,直接调用run
方法会在原线程执行其中的代码,而不是启动新线程。
线程的状态
线程从创建出来之后会有以下几种状态
New(新建)
Runnable(可运行)
Blocked(阻塞)
Waiting(等待)
Timed waiting(计时等待)
Terminated(终止)
新建线程
使用new
创建完一个Thread
对象之后,该线程就处于新建状态,此时这个线程还没有开始运行,其中的代码也没有被执行。
可运行线程
当调用了start
方法之后,线程就处于可运行状态,可运行意味着这个线程可能正在运行,也可能没有运行,需要操作系统提供具体的运行时间,Java语言规范并没有将运行中作为一个单独的状态,一个正在运行的状态仍然处于可运行状态。
阻塞和等待线程
当线程处于阻塞或者等待状态时,它不运行任何代码,而且消耗最少的资源,需要由线程调度器重新激活这个线程。
当一个线程试图获取一个内部的对象锁,而这个锁目前被其他线程占有,该线程就会被阻塞,进入阻塞状态,当所有其他线程都释放了这个锁,并且线程调度器允许该线程持有这个锁时,它将变成非阻塞状态。
当线程等待另一个线程通知调度器出现一个条件时,这个线程会进入等待状态,例如调用了
Object.wait()
、Thread.join()
、Lock.tryLock()
、Condition.await()
等方法如果在调用上述等待状态的方法时传入了超时参数,线程就回进入计时等待状态,额外的还有调用
Thread.sleep()
方法也会进入计时等待状态。
终止线程
有两个原因会导致线程终止:
- run方法执行完毕,正常退出,线程自然终止
- 发生了未被捕获的异常,导致线程意外终止
PS:由于Thread.stop()
方法已被废弃,所以线程无法被手动终止,如需手动终止一个线程,可使用interrupt
方法,然后在线程的run方法中不停的检查当前线程是否被中断,以决定是否继续执行run方法中的代码。
状态切换
下图展示了线程可能的状态以及各个状态间的切换,当一个线程阻塞或者处于等待状态时,线程调度器可以调度另一个线程运行,当线程被重新激活,调度器会检查他是否比当前运行的线程有更高的优先级,如果是,则会剥夺某个线程的运行权,选择高优先级的线程运行。
线程池
在日常开发中,由于线程的创建和销毁比较耗费系统资源,所以应该尽可能的复用线程,线程池就提供了线程复用的能力,在线程池中包含很多准备运行的线程,当我们提交一个runnable对象到线程池中时,就会有线程来调用它的run方法,当run方法退出时,这个线程不会死亡,而是留在池中等待准备为下一个请求服务。
可以通过new ThreadPoolExecutor()
来构造一个自己的线程池,其构造方法如下:
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler)
各个参数的含义分别是:
- corePoolSize:核心线程数
- maximumPoolSize:线程池中最大线程数量
- keepAliveTime:当线程池中空闲线程数量超过corePoolSize时,多余的线程会在多长时间内被销毁
- unit:keepAliveTime的时间单位
- workQueue:任务队列,被添加到线程池中,但尚未被执行的任务
- threadFactory:线程工厂,用于创建线程
- handler:拒绝策略,当任务太多来不及处理时,如何拒绝任务
在上面的参数中,corePoolSize
和maximumPoolSize
决定了线程池中的线程数量,其中corePoolSize
表示正常情况下的线程数量,maximumPoolSize
表示当任务队列已满时最多创建的线程数量,keepAliveTime
和unit
决定了超过核心线程数的剩余线程的存活时间,threadFactory
为线程工厂,一般使用默认的即可,如果需要对线程名等做自定义则需自己提供,workQueue
和handler
较为复杂,下面单独介绍。
workQueue任务队列
线程池采用生产者-消费者模型处理处理任务,当生产者通过Executor.execute(Runnable)
方法提交一个任务到线程池时,线程池会根据当前的任务执行情况和线程的空闲情况决定这个任务是立即执行还是放入一个阻塞队列中,常用的阻塞队列有直接提交队列、有界任务队列、无界任务队列、优先任务队列几种,下面分别说明。
直接提交队列
使用SynchronousQueue
实现,包路径为java.util.concurrent.SynchronousQueue
,是一种特殊的阻塞队列,没有容量,提交的任务不会被保存,总是会立即执行,如果当前线程池内的线程数量小于maximumPoolSize
,则会立即尝试创建新的线程执行任务,否则会直接执行拒绝策略。
上图中核心线程数为1,最大线程数为2,拒绝策略为直接抛出异常,通过日志可以发现,在创建并运行了2个线程后,在尝试提交第3个任务时,执行了拒绝策略,抛出了异常。
有界的任务队列
使用ArrayBlockingQueue
实现,其底层采用数组实现,使用有界任务队列当有新的任务提交时,如果当前线程池中的线程数量小于corePoolSize
,则直接创建新的线程执行任务,否则将任务缓存到队列中,当队列已满时,则继续创建线程直到池中的线程数量达到maximumPoolSize
,此时如果还有新的任务提交,则执行拒绝策略。
[图片上传失败...(image-9aeeeb-1614848387267)]
在上图中,最大线程数为2,采用有界任务队列,可以看到,在执行了2个任务后,直接执行了拒绝策略,然后再执行了5个任务,总共提交了10个任务,可是最终只执行了7个,这是因为开始执行了2个任务,然后有界任务队列中缓存了5个任务,在提交最后3个任务时,执行了拒绝策略,任务丢失,未被执行。
无界任务队列
使用LinkedBlockingQueue
实现,底层采用链表实现,可以无限的往队列中添加任务,线程池中线程的最大的数量就是corePoolSize
,此时的maximumPoolSize
参数是无效的,使用无界任务队列需注意任务的提交与处理之间的平衡,如果大量的任务堆积无法处理,比较容易造成资源耗尽的情况。
在上图中,核心线程数为2,最大线程数为4,采用无界任务队列,共提交了10个任务,通过日志可以看出,只创建了2个线程去执行这些任务,并未创建更多的线程去执行任务。
优先级任务队列
使用PriorityBlockingQueue
实现,是一个特殊的无界队列,与无界队列的区别在于无界队列是按照先进先出的顺序执行任务,而优先级队列是根据的任务的优先级顺序来执行任务,任务的优先级通过Comparable
接口判断,如果向采用优先级队列的线程池提交了未实现Comparable
接口的任务,则会报ClassCastException
。
拒绝策略
在上面的示例中,已经使用了ThreadPoolExecutor
自带的AbortPolicy
,当任务无法处理时,执行该策略直接抛出了异常,ThreadPoolExecutor
还提供了另外几个拒绝策略可供选择:
- AbortPolicy:直接抛出异常,阻止系统正常工作
- CallerRunsPolicy:把任务队列中的任务放在调用者线程当中运行
- DiscardOledestPolicy:丢弃任务队列中最老的一个任务,也就是当前任务队列中最先被添加进去的,马上要被执行的那个任务,并尝试再次提交
- DiscardPolicy策略:丢弃无法处理的任务,不予任何处理。当然使用此策略,业务场景中需允许任务的丢失
根据不同的业务场景可以选择以上几种策略中的任何一个,另外如果以上策略都无法满足需求,也可通过实现RejectedExecutionHandler
接口,自定义拒绝策略
public interface RejectedExecutionHandler {
void rejectedExecution(Runnable r, ThreadPoolExecutor executor);
}
只需实现上面的接口,并在线程池初始化时传入即可,在需要执行拒绝策略时`rejectedExecution就会被调用,参数分别为当前提交的任务和当前的线程池对象。
默认线程池配置
Java通过Executors
类提供了很多默认的线程池配置,其内部也是通过对上述参数的不同配置实现的,如果有满足需求的场景可以直接使用
Executors.newCachedThreadPool()
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
采用立即提交队列,核心线程数为0,最大线程数为Integer.MAX_VALUE
,线程最长存活60s,适用于有大量短生命周期任务提交的场景。
Executors.newFixedThreadPool(int)
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
核心线程数和最大线程数均为传入的int型参数,采用无界队列,包含固定数目的线程数量,且线程会一直保留。
Executors.newSingleThreadExecutor()
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
只有一个线程的线程池,所有的任务会被串行提交执行。
参考
《Java核心技术-卷一》