线程创建和销毁过程花销是比较大的,而频繁创建和销毁,会消耗较大的系统资源时间也有可能导致系统资源不足(线程池可以统一管理创建和销毁过程)
线程池作用:
1、提高效率 创建好一定数量的线程放在池中,等需要使用的时候就从池中拿一个,这要比需要的时候创建一个线程对象要快的多。
2、方便管理 可以编写线程池管理代码对池中的线程同一进行管理。
线程池种类:
1、newFixedThreadPool -定长线程池
创建一个定长线程池,可控制最大并发数,超出的线程会在队列中等待
public static ExecutorService newFixedThreadPool(int nThreads) { return new ThreadPoolExecutor(nThreads, nThreads, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()); }
缺点:固定长度线程池 容易OOM 线程最多 Integer.MAX_VALUE
2、newCachedThreadPool-可缓存线程池
public static ExecutorService newCachedThreadPool() { return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 60L, TimeUnit.SECONDS, new SynchronousQueue<Runnable>());}
创建一个可缓存线程池,如果线程池长度超过处理需要,可灵活回收空闲线程,若无可回收,则新建线程。
3、newSingleThreadExecutor-单线程池
public static ExecutorService newSingleThreadExecutor() { return new FinalizableDelegatedExecutorService (new ThreadPoolExecutor(1, 1, 0L, TimeUnit.MILLISECONDS, new LinkedBlockingQueue<Runnable>()));}
创建一个单线程化的线程池,它只会用唯一的工作线程来执行任务,保证所有任务按照指定顺序(FIFO, LIFO, 优先级)执行。
4、newScheduledThreadPool-定长定时线程池
public static ScheduledExecutorService newScheduledThreadPool(int corePoolSize) { return new ScheduledThreadPoolExecutor(corePoolSize);}
创建一个定长线程池,支持定时及周期性任务执行。
但是实际开发中,一般使用 ThreadPoolExecutor,根据自己需要来进行创建线程池。
以上四种线程池各有弊端:
1)newFixedThreadPool和newSingleThreadExecutor:
主要问题是堆积的请求处理队列可能会耗费非常大的内存,甚至OOM。
2)newCachedThreadPool和newScheduledThreadPool:
主要问题是线程数最大数是Integer.MAX_VALUE,可能会创建数量非常多的线程,甚至OOM。
ThreadPoolExecutor参数
ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,BlockingQueue workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler)
主要参数介绍如下:
1)corePoolSize:核心线程池大小,一般情况下,在创建了线程池后,线程池中的线程数为0,当有任务来之后,就会创建一个线程去执行任务,当线程池中的线程数目达到corePoolSize后,就会把到达的任务放到缓存队列当中;
2) maximumPoolSize:线程池最大创建运行线程数,这个参数也是一个非常重要的参数,它表示在线程池中最多能创建多少个线程;
3)keepAliveTime:表示线程没有任务执行时最多保持多久时间会终止。默认只有线程池中的线程数大于corePoolSize时,keepAliveTime才会起作用,直到线程池中的线程数不大于corePoolSize,即当线程池中的线程数大于corePoolSize时,如果一个线程空闲的时间达到keepAliveTime,则会终止,直到线程池中的线程数不超过corePoolSize。
4)workQueue:阻塞队列,存储等待执行的任务。阻塞队列主要有以下几种;
ArrayBlockingQueue:一个基于数组结构的有界阻塞队列
LinkedBlockingQueue:一个基于链表的阻塞队列,吞吐量要高于ArrayBlockingQueue
SynchronousQueue:一个不存储元素的阻塞队列。每次插入操作必须等到另外一个线程调用移除操作,否则一直处于阻塞状态。吞吐量要高于LinkedBlockingQueue
PriorityBlockingQueue:一个具有优先级的无线阻塞队列
5)threadFactory:用来创建线程
6)handler:当队列和线程池都满了,将会执行下面的策略:
AbortPolicy:丢弃新任务,并抛出 RejectedExecutionException
DiscardPolicy:不做任何操作,直接丢弃新任务
DiscardOldestPolicy:丢弃队列队首(最老)的元素,并执行新任务
CallerRunsPolicy:由当前调用线程来执行新任务
线程池运行原理
在Java线程池的实现逻辑中,线程池所能创建的线程数量受限于corePoolSize和maximumPoolSize两个参数值,线程的创建时机则和corePoolSize和workQueue两个参数相关,当线程数量和队列长度都已达到饱和时,则介入拒绝策略来处理新的任务了,下面把大概的流程说明一下。
1、当来了新任务,如果线程池中空闲线程数量小于corePoolSize,则直接拿线程池中新的线程来处理任务;
2、如果线程池正在运行的线程数量大于等于corePoolSize,而此时workQueue队列未满,则将此任务缓存到队列中;
3、如果线程池正在运行的线程数量大于等于corePoolSize,且workQueue队列已满,但现在的线程数量还小于maximumPoolSize,则创建新的线程来执行任务。
4、如果线程数量已经大于maximumPoolSize且workQueue队列也已经满了,则使用拒绝策略来处理该任务,默认的拒绝策略就是抛出异常(AbortPolicy)。
如何配置线程池大小
配置线程池大小,主要是为了达到将CPU和I/O最大化的目的。
根据任务业务流程,可分为两种:
CPU密集型任务、IO密集型任务
CPU密集型任务
一个完整请求,I/O操作可以在很短时间内完成, CPU还有很多运算要处理,也就是说 CPU 计算的比例占很大一部分
I/O密集型任务
一个完整请求,CPU运算操作完成之后还有很多 I/O 操作要做,也就是说 I/O 操作占比很大部分
线程等待时间占比越高,需要线程越多;线程CPU时间占比例越高,需要线程越少。
CPU 密集型程序创建多少个线程合适
CPU 密集型来说,理论上 线程数量 = CPU 核数(逻辑)就可以了,减少线程切换带来的性能开销,但是实际上,数量一般会设置为 CPU 核数(逻辑)+ 1;
计算(CPU)密集型的线程恰好在某时因为发生一个页错误或者因其他原因而暂停,刚好有一个“额外”的线程,可以确保在这种情况下CPU周期不会中断工作。
I/O密集型程序创建多少个线程合适?
最佳线程数 = CPU核心数 * (1/CPU利用率) = CPU核心数 * (1 + (I/O耗时/CPU耗时))
IO密集型任务则由于需要等待IO操作,线程并不是一直在执行任务,则配置尽可能多的线程,如2*Ncpu。
混合型的任务,如果可以拆分则拆分为IO密集型任务和CPU密集型任务,只要两个任务执行时间相差不大,分解后执行的吞吐量高于串行执行的效率。如果相差太大则没必要进行分解。可以通过Runtime.getRuntime().availableProcessors()方法获得当前设备的CPU个数
参考