线程池
合理利用线程池能够带来以下好处:
- 降低消耗。通过重复利用已创建的线程降低创建和销毁线程的消耗;
- 提高响应速度。当任务到达时,任务可以不需要等待线程创建就能立即执行;
- 提高稳定性。如果无限制的创建线程,不仅会消耗系统资源,还会降低系统的稳定性,使用线程池可以进行统一的分配,调优和监控。
为了使线程池的性能达到最优,需要注意:
- 任务时同类型的,并且相互独立;因为当在线程池中执行独立的任务时,可以随意的改变线程池的大小和配置,这些修改只会对执行性能产生影响。而且如果提交的任务依赖其他任务,很可能产生死锁。
- 尽量避免执行时间较长的任务。如果执行时间很长的任务比较多,除非线程池很大,否则将可能造成“阻塞”,线程池的响应性会变的很糟糕。
ThreadPoolExecutor 框架
在 JUC 中,ThreadPoolExecutor 实现了一个可配置高性能的线程池。库里已经封装了一些常用的的线程池,如果现有的不能满足实际需求,也可以继承它进行修改。ThreadPoolExecutor 继承关系如下图所示:
其中最核心的是 submit 接口,sumbit 内部调用 execute,无非做了一次封装,生成了 Future 对象,通过该对象可以获取任务结果。
构造函数
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler);
- int corePoolSize
线程池的基本大小:当提交一个任务到线程池时,线程池会创建一个线程来执行任务,即使其他空闲的基本线程能够执行新任务也会创建线程,等到需要执行的任务数大于线程池基本大小时就不再创建。如果调用了线程池的prestartAllCoreThreads方法,线程池会提前创建并启动所有基本线程。
- int maximumPoolSize
线程池最大大小,线程池允许创建的最大线程数。如果队列已满,并且已创建的线程数小于最大线程数,则线程池会再创建新的线程执行任务。值得注意的是如果使用了无界的任务队列这个参数就没什么效果
- long keepAliveTime
线程活动保持时间:线程池的工作线程空闲后,保持存活的时间。所以如果任务很多,并且每个任务执行的时间比较短,可以调大这个时间,提高线程的利用率。
- TimeUnit unit
线程活动保持时间的单位
- BlockingQueue<Runnable> workQueue
用于保存等待执行的任务的阻塞队列。一般选用 LinkedBlockingQueue 和 SynchronousQueue。
- ThreadFactory threadFactory
用于设置创建线程的工厂,可以通过线程工厂给每个创建出来的线程设置更有意义的名字,Debug和定位问题时非常又帮助。
- RejectedExecutionHandler handler
当队列和线程池都满了,说明线程池处于饱和状态,那么必须采取一种策略处理提交的新任务。这个策略默认情况下是AbortPolicy,表示无法处理新任务时抛出异常。以下是 JDK 提供的四种策略
- AbortPolicy:直接抛出异常。
- CallerRunsPolicy:只用调用者所在线程来运行任务。
- DiscardOldestPolicy:丢弃队列里最近的一个任务,并执行当前任务。
- DiscardPolicy:不处理,丢弃掉。
参数与管理机制
ThreadPoolExecutor 根据 corePoolSize, maximumPoolSize,keepAliveTime 等参数管理线程。如果线程数量小于 corePoolSize,则新任务到来都会生成新的线程。如果数量大于 corePoolSize,新任务会被加入到阻塞队列中去。如果阻塞队列有界且满,同时线程数量还小于 maximumPoolSize,则会生成新的工作线程帮助完成任务。如果很不幸线程数超过 maximumPoolSize,则按照 RejectedExecutionHandler 处理新到的任务。
如果任务完成且线程处于等待状态,ThreadPoolExecutor 会根据 keepAliveTime 销毁空闲线程,直到线程数量不大于 corePoolSize。但是若调用过 allowCoreThreadTimeOut 接口,corePoolSize 下的线程也会被销毁。
线程管理机制如下图所示:
常用线程池
newFixedThreadPool
public static ExecutorService newFixedThreadPool(int nThreads) {
return new ThreadPoolExecutor(nThreads, nThreads,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>());
}
corePoolSize 和 maximumPoolSize 同为 nThreads, 使用无界阻塞队列 LinkedBlockingQueue。因此线程池中线程数量固定,多余的任务会被加入无界链表阻塞队列。
newSingleThreadExecutor
public static ExecutorService newSingleThreadExecutor() {
return new FinalizableDelegatedExecutorService
(new ThreadPoolExecutor(1, 1,
0L, TimeUnit.MILLISECONDS,
new LinkedBlockingQueue<Runnable>()));
}
corePoolSize 和 maximumPoolSize 同为 1, 使用无界阻塞队列 LinkedBlockingQueue。因此线程池中只有 1 条线程,多余的任务会被加入无界链表阻塞队列。
newCachedThreadPool
public static ExecutorService newCachedThreadPool() {
return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
60L, TimeUnit.SECONDS,
new SynchronousQueue<Runnable>());
}
corePoolSize 为 0, maximumPoolSize 是 Integer 极大值,采用 SynchronousQueue 阻塞队列。也就是说若没有空闲线程,线程池会为每个任务创建一个线程。空闲线程会等待 60 秒接收新任务,若没有新任务则会被销毁。最后所有线程都会被销毁。
合理配置
如何合理配置线程池大小,仅供参考。一般需要根据任务的类型来配置线程池大小:
如果是CPU密集型任务,就需要尽量压榨CPU,参考值可以设为 NCPU+1
如果是IO密集型任务,参考值可以设置为2*NCPU,因为并不是所有任务都是在计算中,很多是等候 IO。
当然,这只是一个参考值,具体的设置还需要根据实际情况进行调整,比如可以先将线程池大小设置为参考值,再观察任务运行情况和系统负载、资源利用率来进行适当调整。
内容来源
Java 并发编程实战
http://825635381.iteye.com/blog/2184680
http://www.cnblogs.com/zhanjindong/p/java-concurrent-package-ThreadPoolExecutor.html