线程池是一种多线程处理形式,处理过程中将任务添加到队列,然后在创建线程后自动启动这些任务。
线程池是帮助我们处理以及管理多线程的。若是没有线程池,则每当有任务到达时都会新建一个线程来自处理,若任务特别多的时候,就会无休止的创建很多线程,这不但会消耗系统的资源,还会降低整个系统的稳定性。
然而有了线程池,则会通过对已创建线程的重复利用,降低创建和销毁线程时的资源消耗。同时,若是有任务到达,可以复用之前创建的线程不需要再去创建新的线程。同时可以规定线程池的大小,并对线程进行调优和监控,降低对整个系统的影响。
这七个参数分别是:核心线程数,最大线程数,最大空闲时间,时间单位,阻塞队列,线程工厂,拒绝策略
我们结合当下的一个例子聊聊这七个参数
假如我们有一个公司,有几个核心员工,也有几个外包员工,有招人的hr,也有个项目经理。 员工干活,hr招人,项目经理接任务。
就是核心员工,干活滴,不会被开除。这个公司最少会有这么多人在干活。
核心线程数就是这个线程池最低保持的线程数量
这是所有员工,老板给定的最大人数,核心员工+外包的数量,最多也就这么多人。
也就是这个线程池所能容纳的最多的线程数量。当设定这个值的时候,若是小于核心线程数,会抛出非法参数的错。
这就有意思了,当外包人员没活了,在空闲这么多时间之后,就会给嘎掉,告辞了各位。
也就是说,非核心线程在这么多时间没有执行任务之后会被关闭。
这就是上边最大空闲时间的单位,外包人员看到个10,以为10天,暗自庆幸,还有时间找找新的,结果,10min,哈哈,10分钟后走人。
项目经理,活全在他这里放着,干活的从这里领活然后去处理。
线程池存放任务的队列,用来存储线程池的所有待执行任务。
这就是个hr,线程池创建之后,有任务来了,先招聘核心员工,当核心员工忙不过来的时候,再招聘外包员工。
线程池创建线程时调用的工厂方法。
当公司里每个人都有活干,这里包括核心员工和外包员工,并且项目经理那里也已经堆满了的时候,再有任务来的时候的处理方式
当下有四种处理方式
这个在我们环境引起过一个bug,我们使用的DiscardPolicy这个拒绝策略,导入8万个用户资料的时候,五个线程处理,阻塞队列的大小只有5万,这样,导入的时候只会有5万个用户被导入成功,其余的用户不见了,找了许久才发现问题在这里。也没改策略,吧导入的文件拆成了两个,分别导入了。
也可以自定义一个拒绝策略,实现RejectedExecutionHandle接口,并重写rejectedeExecution方法即可
线程池有五个状态
那么这里为啥要一个TIDYING这个过渡状态呢?是为了确保SHUTDOWN和STOP状态中的工作线程都已经关闭。在这个状态下执行了执行terminated()方法之后这才会到TERMINATED状态。也就是说我们可以重写这个方法,来处理一些线程池关闭之后的事情。
并且线程池的状态是在ctl属性中记录的。本质是个int类型,ctl的高三位记录线程池状态
在低29位,才会记录工作线程个数。也就是说即便指定的线程最大数量是Integer.MAX_VALUE他也到不了,一个线程池的最多线程也就是2的29次方个了。
核心线程不是new完就构建的,是懒加载的机制,添加任务才会构建核心线程,具体流程看下图:
这里我们可以看到很重要的一点,当任务队列满的时候,才会创建非核心线程。
线程会挂起,默认核心线程是WAITING状态,非核心是TIMED_WAITING
如果是核心线程,默认情况下,会在阻塞队列的位置执行take()方法,直到拿到任务为止。就是说,一直等,有活我就干,没活就一直等。
如果是非核心线程,默认情况下,会在阻塞队列的位置执行poll()方法,等待最大空闲时间,如果没任务,直接嘎掉,如果有活,那就正常干。