要使用一门技术肯定要先了解它,要使用线程池也一定要了解线程池使用的情况和基本参数。
使用线程池有优势与限制场景
利用Executor框架可以解耦任务的提交和任务的执行,使得任务的提交和任务的执行更加灵活,同时也简化了代码,不过在有些情况下因为任务不适合解耦。
比如一个任务依赖另一个任务的执行,或者任务只能在单线程中执行(为了确保执行顺序),在比如对一些响应要求比较高的任务都不适合放到线程池中执行。
一般来说只有任务是同类型的并且相互独立,线程池的性能才能达到最佳。
线程池大小设置
线程池大小的设置也是一个需要注意的问题,线程池设置过大会出现大量线程在比较少的CPU和内存资源上发生竞争,会导致更高的内存使用量,还有可能耗尽资源,但是如果线程池过小,那么将导致许多空闲的处理器无法执行工作,更多的任务处于等待状态响应变慢,从而降低吞吐率。
线程池大小设置要考虑服务器的CPU、内存、计算密集型还是I/O密集型等方面,尤其是计算密集型和I/O密集型属于不同类型的任务,他们最好分成多个线程池不要放到一个线程池中。
计算密集型运行一般较快,基本不会出现阻塞,线程可以很快处理完成马上执行下一个任务,所以线程池大小可以设置成服务器CPU核数+1,节省资源的同时也能保证充分利用CPU。
对于包含I/O或者其他阻塞操作的任务,由于线程不会一直执行,为了支持更多的任务线程池的数量设置的就会更大,当然要更加准确的设置线程池数量就要估算任务的等待时间和计算时间的比值。
如果任务的执行还需要通过获取其他线程池资源,比如需要连接数据库就需要数据库线程池,那么数据库线程池的数量也是限制任务线程的因素之一。
线程池基本参数
线程最通用的初始化方式如下图:
这是最基础的线程池初始化方式,包含了设置线程池需要的基础参数,主要参数功能解释如下:
corePoolSize:线程池核心线程数,当没有任务执行时线程池大小,当工作队列满了才会创建超过这个数量的线程;
maximumPoolSize:最大线程数,线程池能拥有的最大线程数量;
keepAliveTime:活跃时间,当一个线程空闲超过这个时间,并且线程池线程数超过了核心线程数,这个线程将被回收;
通过调节上面这三个参数可以控制资源的使用,比如newFixedThreadPool创建的线程池就是把corePoolSize与maximumPoolSize设置为相同值,并且永远不会超时,这样线程池中的线程数量永远不会改变。
newCachedThreadPool是把corePoolSize设置为0,maximumPoolSize设置为Integer的最大值,keepAliveTime设置为一分钟,线程池的数量可以根据任务数扩展或收缩,任务多就创建线程,没有任务则回收所有线程。
workQueue是一个阻塞队列,用来保存等待执行的任务,排队基本方法有三种:无界队列、有界队列、同步移交。
newFixedThreadPool和newSingleThreadExecutor默认使用无界队列LinkedBlockingQueue,如果所有工作线程都处于忙碌状态,那么任务将在队列中等候,如果任务持续提交,队列将无限制增加。
队列无限增加存在一定的风险,比如任务提交太多太快,队列中太多会造成内存溢出,保证安全的办法是使用有界队列,比如ArrayBlockingQueue,但是使用有界队列会出现新问题,如果等待队列满了再继续执行任务该怎么处理?
这里就要说最后一个参数了“RejectedExecutionHandler handler”拒绝策略,拒绝策略主要有四种AbortPolicy(中止)、CallerRunsPolicy(调用者运行)、DiscardPolicy(抛弃)、DiscardestPolicy(抛弃最旧的);
AbortPolicy(中止):默认拒绝策略,提交任务时如果无法保存到队列中时会抛出RejectedExecutionException。由调用捕获并处理;
DiscardPolicy(抛弃):直接抛弃这个任务;
DiscardestPolicy(抛弃最旧的):会抛弃最前面的任务也就是即将执行的任务,然后尝试重新提交当前任务;
CallerRunsPolicy(调用者运行):将任务回退到调用者;
还有一个参数“ThreadFactory threadFactory”创建工作线程的工厂,也就是线程池支持我们自定义创建线程的方式,这样我们就可以做很多事情,比如设置线程池创建线程的线程名字,还可以做一些统计、日志等。
线程池的扩展
ThreadPoolExecutor还提供了几个可以重写的方法”beforeExecute(Thread t, Runnable r)”、“afterExecute(Runnable r, Throwable t)”、“terminated()”。
这几个方法都很见名知意,beforeExecute抛出异常任务不会被执行,afterExecute也不执行。任务不管是正常返回还是抛出一个异常都会执行afterExecute方法,当线程池完成关闭操作后会执行terminated方法,通过重写这几个方法可以添加日志、计时、监视、统计等信息。
总结
ThreadPoolExecutor作为多线程的基础,一定要了解它的基本功能,学习了ThreadPoolExecutor的最基础参数实际上也可以了解它的一些基本的工作流程,这些最基础的知识也是面试中经常问到的问题。
Java程序员日常学习笔记,如理解有误欢迎各位交流讨论!