在程序中,我们会用各种池化技术来缓存创建昂贵的对象,比如线程池、连接池、内存池。一般是预先创建一些对象放入池中,使用的时候直接取出使用,用完归还以便复用,还会通过一定的策略调整池中缓存对象的数量,实现池的动态伸缩。
由于线程的创建比较昂贵,随意、没有控制地创建大量线程会造成性能问题,因此短平快的任务一般考虑使用线程池来处理,而不是直接创建线程。
那么,如何正确的创建并正确的使用线程池呢,这篇文章就来细看下。
虽然在 Java 语言中创建线程看上去就像创建一个对象一样简单,只需要 new Thread() 就可以了,但实际上创建线程远不是创建一个对象那么简单。
创建对象,仅仅是在 JVM 的堆里分配一块内存而已;而创建一个线程,却需要调用操作系统内核的 API,然后操作系统要为线程分配一系列的资源,这个成本就很高了。所以线程是一个重量级的对象,应该避免频繁创建和销毁,一般就是采用线程池来避免频繁的创建和销毁线程。
Java 通过用户线程与内核线程结合的 1:1 线程模型来实现,Java 将线程的调度和管理设置在了用户态。在 HotSpot VM 的线程模型中,Java 线程被一对一映射为内核线程。Java 在使用线程执行程序时,需要创建一个内核线程;当该 Java 线程被终止时,这个内核线程也会被回收。因此 Java 线程的创建与销毁将会消耗一定的计算机资源,从而增加系统的性能开销。
除此之外,大量创建线程同样会给系统带来性能问题,因为内存和 CPU 资源都将被线程抢占,如果处理不当,就会发生内存溢出、CPU 使用率超负荷等问题。
为了解决上述两类问题,Java 提供了线程池概念,对于频繁创建线程的业务场景,线程池可以创建固定的线程数量,并且在操作系统底层,轻量级进程将会把这些线程映射到内核。
线程池可以提高线程复用,又可以固定最大线程使用量,防止无限制地创建线程。当程序提交一个任务需要一个线程时,会去线程池中查找是否有空闲的线程,若有,则直接使用线程池中的线程工作,若没有,会去判断当前已创建的线程数量是否超过最大线程数量,如未超过,则创建新线程,如已超过,则进行排队等待或者直接抛出异常。
线程池的设计,普遍采用的都是生产者 - 消费者模式。线程池的使用方是生产者,线程池本身是消费者。
原理实现大致如下:
1 package com.lyyzoo.test.concurrent.executor;
2
3 import java.util.ArrayList;
4 import java.util.List;
5 import java.util.concurrent.BlockingQueue;
6 import java.util.concurrent.LinkedBlockingQueue;
7
8 /**
9 * @author bojiangzhou 2020/02/12
10 */
11 public class CustomThreadPool {
12
13 public static void main(String[] args) {
14 // 使用有界阻塞队列 创建线程池
15 CustomThreadPool pool = new CustomThreadPool(2, new LinkedBlockingQueue<>(10));
16 pool.execute(() -> {
17 System.out.println("提交了一个任务");
18 });
19 }
20
21 // 利用阻塞队列实现生产者-消费者模式
22 final BlockingQueue<Runnable> workQueue;
23 // 保存内部工作线程
24 final List<Thread> threads = new ArrayList<>();
25
26 public CustomThreadPool(int coreSize, BlockingQueue<Runnable> workQueue) {
27 this.workQueue = workQueue;
28 // 创建工作线程
29 for (int i = 0; i < coreSize; i++) {
30 WorkerThread work = new WorkerThread();
31 work.start();
32 threads.add(work);
33 }
34 }
35
36 // 生产者 提交任务
37 public void execute(Runnable command) {
38 try {
39 // 队列已满,put 会一直等待
40 workQueue.put(command);
41 } catch (InterruptedException e) {
42 e.printStackTrace();
43 }
44 }
45
46 /**
47 * 工作线程负责消费任务,并执行任务
48 */
49 class WorkerThread extends Thread {
50 @Override
51 public void run() {
52 // 循环取任务并执行,take 取不到任务会一直等待
53 while (true) {
54 try {
55 Runnable runnable = workQueue.take();
56 runnable.run();
57 } catch (InterruptedException e) {
58 e.printStackTrace();
59 }
60 }
61 }
62 }
63 }
Java 提供的线程池相关的工具类中,最核心的是 ThreadPoolExecutor,通过名字也能看出来,它强调的是 Executor,而不是一般意义上的池化资源。
ThreadPoolExecutor 的构造函数非常复杂,这个最完备的构造函数有 7 个参数:
各个参数的含义如下:
ThreadPoolExecutor 构造完成后,还可以通过如下方法定制默认行为:
创建线程池示例:
1 public void test() throws InterruptedException {
2 ThreadPoolExecutor poolExecutor = new ThreadPoolExecutor(
3 // 核心线程数
4 2,
5 // 最大线程数
6 16,
7 // 线程空闲时间
8 60, TimeUnit.SECONDS,
9 // 使用有界阻塞队列
10 new LinkedBlockingQueue<>(1024),
11 // 定义线程创建方式,可自定线程名称
12 new ThreadFactoryBuilder().setNameFormat("executor-%d").build(),
13 // 自定义拒绝策略,一般和降级策略配合使用
14 (r, executor) -> {
15 // 队列已满,拒绝执行
16 throw new RejectedExecutionException("Task " + r.toString() +
17 " rejected from " + executor.toString());
18 }
19 );
20
21 poolExecutor.submit(() -> {
22 LOGGER.info("submit task");
23 });
24 }
任务提交后的大致流程如下图所示。提交任务后,如果线程数小于 corePoolSize,则创建新线程执行任务,无论当前线程池的线程是否空闲都会创建新的线程。
当创建的线程数等于 corePoolSize 时,提交的任务会被加入到设置的阻塞队列中。
当队列满了,则会创建非核心线程执行任务,直到线程池中的线程数量等于 maximumPoolSize。
当线程数量已经等于 maximumPoolSize 时, 新提交的任务无法加入到等待队列,也无法创建非核心线程直接执行,如果没有为线程池设置拒绝策略,这时线程池就会抛出 RejectedExecutionException 异常,即默认拒绝接受任务。
线程池默认的拒绝策略就是丢弃任务,所以我们在设置有界队列时,需要考虑设置合理的拒绝策略,要考虑到高峰时期任务的数量,避免任务被丢弃而影响业务流程。
创建 ThreadPoolExecutor 时强烈建议使用有界队列。如果设置为无界队列,那么一般最大线程数的设置是不起作用的,而且遇到任务高峰时,如果一直往队列添加任务,容易出现OOM,抛出如下异常。
Exception in thread "http-nio-45678-ClientPoller"
java.lang.OutOfMemoryError: GC overhead limit exceeded
使用有界队列时,需要注意,当任务过多时,线程池会触发执行拒绝策略,线程池默认的拒绝策略会抛出 RejectedExecutionException,这是个运行时异常,对于运行时异常编译器并不强制 catch 它,所以开发人员很容易忽略,因此默认拒绝策略要慎重使用。如果线程池处理的任务非常重要,建议自定义自己的拒绝策略;并且在实际工作中,自定义的拒绝策略往往和降级策略配合使用。
建议用一些监控手段来观察线程池的状态。线程池这个组件往往会表现得任劳任怨、默默无闻,除非是出现了拒绝策略,否则压力再大都不会抛出一个异常。如果我们能提前观察到线程池队列的积压,或者线程数量的快速膨胀,往往可以提早发现并解决问题。
1 public static void displayThreadPoolStatus(ThreadPoolExecutor threadPool, String threadPoolName, long period, TimeUnit unit) { 2 Executors.newSingleThreadScheduledExecutor().scheduleAtFixedRate(() -> { 3 LOGGER.info("[>>ExecutorStatus<<] ThreadPool Name: [{}], Pool Status: [shutdown={}, Terminated={}], Pool Thread Size: {}, Active Thread Count: {}, Task Count: {}, Tasks Completed: {}, Tasks in Queue: {}", 4 threadPoolName, 5 threadPool.isShutdown(), threadPool.isTerminated(), // 线程是否被终止 6 threadPool.getPoolSize(), // 线程池线程数量 7 threadPool.getActiveCount(), // 工作线程数 8 threadPool.getTaskCount(), // 总任务数 9 threadPool.getCompletedTaskCount(), // 已完成的任务数 10 threadPool.getQueue().size()); // 线程池中线程的数量 11 }, 0, period, unit); 12 }
提交任务可以通过 execute 和 submit 方法提交任务,下面就来看下它们的区别。
submit 方法签名:
execute 方法签名:
使用 execute 提交任务,线程池内抛出异常会导致线程退出,线程池只能重新创建一个线程。如果每个异步任务都以异常结束,那么线程池可能完全起不到线程重用的作用。
而且主线程无法捕获(catch)到线程池内抛出的异常。因为没有手动捕获异常进行处理,ThreadGroup 帮我们进行了未捕获异常的默认处理,向标准错误输出打印了出现异常的线程名称和异常信息。显然,这种没有以统一的错误日志格式记录错误信息打印出来的形式,对生产级代码是不合适的。
如下,execute 提交任务,抛出异常后,从线程名称可以看出,老线程退出,创建了新的线程。
ThreadGroup 处理未捕获异常:直接输出到 System.err
解决方式:
1 // 自定义线程池的未捕获异常处理程序
2 ThreadPoolExecutor executor = new ThreadPoolExecutor(8, 8,
3 30, TimeUnit.MINUTES,
4 new LinkedBlockingQueue<>(),
5 new ThreadFactoryBuilder()
6 .setNameFormat("pool-%d")
7 .setUncaughtExceptionHandler((Thread t, Throwable e) -> {
8 log.error("pool happen exception, thread is {}", t, e);
9 })
10 .build());
11
12 // 设置全局的默认未捕获异常处理程序
13 static {
14 Thread.setDefaultUncaughtExceptionHandler((thread, throwable)-> {
15 log.error("Thread {} got exception", thread, throwable)
16 });
17 }
定义的异常处理程序将未捕获的异常信息打印到标准日志中了,老线程同样会退出。如果要避免这个问题,就需要使用 submit 方法提交任务。
使用 submit,线程不会退出,但是异常不会记录,会被生吞掉。查看 FutureTask 源码可以发现,在执行任务出现异常之后,异常存到了一个 outcome 字段中,只有在调用 get 方法获取 FutureTask 结果的时候,才会以 ExecutionException 的形式重新抛出异常。所以我们可以通过捕获 get 方法抛出的异常来判断线程的任务是否抛出了异常。
submit 提交任务,可以通过 Future 获取返回结果,如果抛出异常,可以捕获 ExecutionException 得到异常栈信息。通过线程名称可以看出,老线程也没有退出。
需要注意的是,使用 submit 时,setUncaughtExceptionHandler 设置的异常处理器不会生效。
execute提交的是Runnable类型的任务,而submit提交的是Callable或者Runnable类型的任务;
execute的提交没有返回值,而submit的提交会返回一个Future类型的对象;
execute提交的时候,如果有异常,就会直接抛出异常,而submit在遇到异常的时候,通常不会立马抛出异常,而是会将异常暂时存储起来,等待你调用Future.get()方法的时候,才会抛出异常;
execute 提交的任务抛出异常,老线程会退出,线程池会立即创建一个新的线程。submit 提交的任务抛出异常,老线程不会退出;
线程池设置的 UncaughtExceptionHandler 对 execute 提交的任务生效,对 submit 提交的任务不生效。
创建多少线程合适,要看多线程具体的应用场景。我们的程序一般都是 CPU 计算和 I/O 操作交叉执行的,由于 I/O 设备的速度相对于 CPU 来说都很慢,所以大部分情况下,I/O 操作执行的时间相对于 CPU 计算来说都非常长,这种场景我们一般都称为 I/O 密集型计算;和 I/O 密集型计算相对的就是 CPU 密集型计算了,CPU 密集型计算大部分场景下都是纯 CPU 计算。I/O 密集型程序和 CPU 密集型程序,计算最佳线程数的方法是不同的。
多线程本质上是提升多核 CPU 的利用率,所以对于一个 4 核的 CPU,每个核一个线程,理论上创建 4 个线程就可以了,再多创建线程也只是增加线程切换的成本。所以,对于 CPU 密集型的计算场景,理论上“线程的数量 = CPU 核数”就是最合适的。不过在工程上,线程的数量一般会设置为“CPU 核数 +1”,这样的话,当线程因为偶尔的内存页失效或其他原因导致阻塞时,这个额外的线程可以顶上,从而保证 CPU 的利用率。
如果 CPU 计算和 I/O 操作的耗时是 1:1,那么 2 个线程是最合适的。如果 CPU 计算和 I/O 操作的耗时是 1:2,那设置 3 个线程是合适的,如下图所示:CPU 在 A、B、C 三个线程之间切换,对于线程 A,当 CPU 从 B、C 切换回来时,线程 A 正好执行完 I/O 操作。这样 CPU 和 I/O 设备的利用率都达到了 100%。
会发现,对于 I/O 密集型计算场景,最佳的线程数是与程序中 CPU 计算和 I/O 操作的耗时比相关的,可以总结出这样一个公式:最佳线程数 =1 +(I/O 耗时 / CPU 耗时)
对于多核 CPU,需要等比扩大,计算公式如下:最佳线程数 =CPU 核数 * [ 1 +(I/O 耗时 / CPU 耗时)]
可通过如下方式获取CPU核数:
1 /**
2 * 获取返回CPU核数
3 *
4 * @return 返回CPU核数,默认为8
5 */
6 public static int getCpuProcessors() {
7 return Runtime.getRuntime() != null && Runtime.getRuntime().availableProcessors() > 0 ?
8 Runtime.getRuntime().availableProcessors() : 8;
9 }
在一些非核心业务中,我们可以将核心线程数设置小一些,最大线程数量设置为CPU核心数量,阻塞队列大小根据具体场景设置;不要过大,防止大量任务进入等待队列而超时,应尽快创建非核心线程执行任务;也不要过小,避免队列满了任务被拒绝丢弃。
1 public ThreadPoolExecutor executor() {
2 int coreSize = getCpuProcessors();
3 ThreadPoolExecutor executor = new ThreadPoolExecutor(
4 2, coreSize,
5 10, TimeUnit.MINUTES,
6 new LinkedBlockingQueue<>(512),
7 new ThreadFactoryBuilder().setNameFormat("executor-%d").build(),
10 new ThreadPoolExecutor.AbortPolicy()
11 );14
15 return executor;
16 }
在一些核心业务中,核心线程数设置为CPU核心数,最大线程数可根据公式 最佳线程数 =CPU 核数 * [ 1 +(I/O 耗时 / CPU 耗时)] 来计算。阻塞队列可以根据具体业务场景设置,如果线程处理业务非常迅速,我们可以考虑将阻塞队列设置大一些,处理的请求吞吐量会大些;如果线程处理业务非常耗时,阻塞队列设置小些,防止请求在阻塞队列中等待过长时间而导致请求已超时。
public ThreadPoolExecutor executor() {
int coreSize = getCpuProcessors();
ThreadPoolExecutor executor = new ThreadPoolExecutor(
coreSize, coreSize * 8,
30, TimeUnit.MINUTES,
new LinkedBlockingQueue<>(1024),
new ThreadFactoryBuilder().setNameFormat("executor-%d").build(),
new ThreadPoolExecutor.AbortPolicy()
);return executor;
}
注意:一般不要将 corePoolSize 设置为 0,例如下面的线程池,使用了无界队列,虽 maximumPoolSize > 0,但实际上只会有一个工作线程,因为其它任务都加入等待队列了。
1 ThreadPoolExecutor executor = new ThreadPoolExecutor(0, 5, 30, TimeUnit.SECONDS,
3 new LinkedBlockingQueue<>(),
4 new ThreadFactoryBuilder().setNameFormat("test-%d").build()
5 );
如果想让线程池激进一点,优先开启更多的线程,而把队列当成一个后备方案,可以自定义队列,重写 offer 方法,因为线程池是通过 offer 方法将任务放入队列。
通过重写队列的 offer 方法,直接返回 false,造成这个队列已满的假象,线程池在工作队列满了无法入队的情况下会扩容线程池。直到线程数达到最大线程数,就会触发拒绝策略,此时再通过自定义的拒绝策略将任务通过队列的 put 方法放入队列中。这样就可以优先开启更多线程,而不是进入队列了。
1 public static void main(String[] args) {
2 // ThreadPoolExecutor 通过 offer 将元素放入队列,重载队列的 offer 方法,直接返回 false,造成队列已满的假象
3 // 队列满时,会创建新的线程直到达到 maximumPoolSize,之后会触发执行拒绝策略
4 LinkedBlockingQueue<Runnable> queue = new LinkedBlockingQueue<Runnable>() {
5 private static final long serialVersionUID = 8303142475890427046L;
6
7 @Override
8 public boolean offer(Runnable e) {
9 return false;
10 }
11 };
12
13 // 当线程达到 maximumPoolSize 时会触发拒绝策略,此时将任务 put 到队列中
14 RejectedExecutionHandler rejectedExecutionHandler = new RejectedExecutionHandler() {
15 @Override
16 public void rejectedExecution(Runnable r, ThreadPoolExecutor executor) {
17 try {
18 // 任务拒绝时,通过 put 放入队列
19 queue.put(r);
20 } catch (InterruptedException e) {
21 Thread.currentThread().interrupt();
22 }
23 }
24 };
25
26 // 构造线程池
27 ThreadPoolExecutor executor = new ThreadPoolExecutor(2, 4,
28 600, TimeUnit.SECONDS,
29 queue,
30 new ThreadFactoryBuilder().setNameFormat("demo-%d").build(),
31 rejectedExecutionHandler);
32
33 IntStream.rangeClosed(1, 50).forEach(i -> {
34 executor.submit(() -> {
35 log.info("start...");
36 sleep(9000);
37 });
38 });
39 }
在程序中,我们不能随便中断一个线程,因为这是极其不安全的操作,我们无法知道这个线程正运行在什么状态,它可能持有某把锁,强行中断可能导致锁不能释放的问题;或者线程可能在操作数据库,强行中断导致数据不一致混乱的问题。正因此,JAVA里将Thread的stop方法设置为过时,以禁止大家使用。
优雅地终止线程,不是自己终止自己,而是在一个线程 T1 中,终止线程 T2;这里所谓的“优雅”,指的是给 T2 一个机会料理后事,而不是被一剑封喉。两阶段终止模式,就是将终止过程分成两个阶段,其中第一个阶段主要是线程 T1 向线程 T2发送终止指令,而第二阶段则是线程 T2响应终止指令。
Java 线程进入终止状态的前提是线程进入 RUNNABLE 状态,而实际上线程也可能处在休眠状态,也就是说,我们要想终止一个线程,首先要把线程的状态从休眠状态转换到 RUNNABLE 状态。如何做到呢?这个要靠 Java Thread 类提供的 interrupt() 方法,它可以将休眠状态的线程转换到 RUNNABLE 状态。
线程转换到 RUNNABLE 状态之后,我们如何再将其终止呢?RUNNABLE 状态转换到终止状态,优雅的方式是让 Java 线程自己执行完 run() 方法,所以一般我们采用的方法是设置一个标志位,然后线程会在合适的时机检查这个标志位,如果发现符合终止条件,则自动退出 run() 方法。这个过程其实就是第二阶段:响应终止指令。终止指令,其实包括两方面内容:interrupt() 方法和线程终止的标志位。
如果我们在线程内捕获中断异常(如Thread.sleep()抛出了中断一次)之后,需通过 Thread.currentThread().interrupt() 重新设置线程的中断状态,因为 JVM 的异常处理会清除线程的中断状态。
建议自己设置线程终止标志位,避免线程内调用第三方类库的方法未处理线程中断状态,如下所示。
1 public class InterruptDemo {
2
3 /**
4 * 输出:调用 interrupt() 时,只是设置了线程中断标识,线程依旧会继续执行当前方法,执行完之后再退出线程。
5 * do something...
6 * continue do something...
7 * do something...
8 * continue do something...
9 * do something...
10 * 线程被中断...
11 * continue do something...
12 */
13 public static void main(String[] args) throws InterruptedException {
14 Proxy proxy = new Proxy();
15 proxy.start();
16
17 Thread.sleep(6000);
18 proxy.stop();
19 }
20
21 static class Proxy {
22 // 自定义线程终止标志位
23 private volatile boolean terminated = false;
24
25 private boolean started = false;
26
27 Thread t;
28
29 public synchronized void start() {
30 if (started) {
31 return;
32 }
33 started = true;
34 terminated = false;
35
36 t = new Thread(() -> {
37 while (!terminated) { // 取代 while (true)
38 System.out.println("do something...");
39 try {
40 Thread.sleep(2000);
41 } catch (InterruptedException e) {
42 // 如果其它线程中断此线程,抛出异常时,需重新设置线程中断状态,因为 JVM 的异常处理会清除线程的中断状态。
43 System.out.println("线程被中断...");
44 Thread.currentThread().interrupt();
45 }
46 System.out.println("continue do something...");
47 }
48 started = false;
49 });
50 t.start();
51 }
52
53 public synchronized void stop() {
54 // 设置中断标志
55 terminated = true;
56 t.interrupt();
57 }
58 }
59
60 }
线程池提供了两个方法来中断线程池:shutdown() 和 shutdownNow()。
shutdown():是一种很保守的关闭线程池的方法。线程池执行 shutdown() 后,就会拒绝接收新的任务,但是会等待线程池中正在执行的任务和已经进入阻塞队列的任务都执行完之后才最终关闭线程池。
shutdownNow():相对激进一些,线程池执行 shutdownNow() 后,会拒绝接收新的任务,同时还会中断线程池中正在执行的任务,已经进入阻塞队列的任务也被剥夺了执行的机会,不过这些被剥夺执行机会的任务会作为 shutdownNow() 方法的返回值返回。因为 shutdownNow() 方法会中断正在执行的线程,所以提交到线程池的任务,如果需要优雅地结束,就需要正确地处理线程中断。如果提交到线程池的任务不允许取消,那就不能使用 shutdownNow() 方法终止线程池。
如果想在jvm关闭的时候进行内存清理、对象销毁等操作,或者仅仅想起个线程然后这个线程不会退出,可以使用Runtime.addShutdownHook。
这个方法的作用就是在JVM中增加一个关闭的钩子。当程序正常退出、系统调用 System.exit 方法或者虚拟机被关闭时才会执行系统中已经设置的所有钩子,当系统执行完这些钩子后,JVM才会关闭。
利用这个性质,就可以在这个最后执行的线程中把线程池优雅的关闭掉。虽然jvm关闭了,但优雅关闭线程池总是好的,特别是涉及到服务端的 tcp 连接。
1 /**
2 * 添加Hook在Jvm关闭时优雅的关闭线程池
3 *
4 * @param threadPool 线程池
5 * @param threadPoolName 线程池名称
6 */
7 public static void hookShutdownThreadPool(ExecutorService threadPool, String threadPoolName) {
8 Runtime.getRuntime().addShutdownHook(new Thread(() -> {
9 LOGGER.info("[>>ExecutorShutdown<<] Start to shutdown the thead pool: [{}]", threadPoolName);
10 // 使新任务无法提交
11 threadPool.shutdown();
12 try {
13 // 等待未完成任务结束
14 if (!threadPool.awaitTermination(60, TimeUnit.SECONDS)) {
15 threadPool.shutdownNow(); // 取消当前执行的任务
16 LOGGER.warn("[>>ExecutorShutdown<<] Interrupt the worker, which may cause some task inconsistent. Please check the biz logs.");
17
18 // 等待任务取消的响应
19 if (!threadPool.awaitTermination(60, TimeUnit.SECONDS)) {
20 LOGGER.error("[>>ExecutorShutdown<<] Thread pool can‘t be shutdown even with interrupting worker threads, which may cause some task inconsistent. Please check the biz logs.");
21 }
22 }
23 } catch (InterruptedException ie) {
24 // 重新取消当前线程进行中断
25 threadPool.shutdownNow();
26 LOGGER.error("[>>ExecutorShutdown<<] The current server thread is interrupted when it is trying to stop the worker threads. This may leave an inconsistent state. Please check the biz logs.");
27
28 // 保留中断状态
29 Thread.currentThread().interrupt();
30 }
31
32 LOGGER.info("[>>ExecutorShutdown<<] Finally shutdown the thead pool: [{}]", threadPoolName);
33 }));
34 }
考虑到 ThreadPoolExecutor 的构造函数实在是有些复杂,所以 Java 并发包里提供了一个线程池的静态工厂类 Executors,利用 Executors 你可以快速创建线程池。
但《阿里巴巴 Java 开发手册》中提到,禁止使用这些方法来创建线程池,而应该手动 new ThreadPoolExecutor 来创建线程池。最重要的原因是:Executors 提供的很多方法默认使用的都是无界的 LinkedBlockingQueue,高负载情境下,无界队列很容易导致 OOM,而 OOM 会导致所有请求都无法处理,这是致命问题。最典型的就是 newFixedThreadPool 和 newCachedThreadPool,可能因为资源耗尽导致 OOM 问题。
具有缓存性质的线程池,线程最大空闲时间60s,线程可重复利用,没有最大线程数限制。使用的是 SynchronousQueue 无容量阻塞队列,没有最大线程数限制。这意味着,只要有请求到来,就必须找到一条工作线程来处理,如果当前没有空闲的线程就再创建一条新的。
高并发情况下,大量的任务进来后会创建大量的线程,导致OOM(无法创建本地线程):
1 [11:30:30.487] [http-nio-45678-exec-1] [ERROR] [.a.c.c.C.[.[.[/].[dispatcherServlet]:175 ] - Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Handler dispatch failed;
2 nested exception is java.lang.OutOfMemoryError: unable to create new native thread] with root cause
3 java.lang.OutOfMemoryError: unable to create new native thread
具有固定数量的线程池,核心线程数等于最大线程数,超出最大线程数进行等待。使用的是 LinkedBlockingQueue 无界阻塞队列。虽然使用 newFixedThreadPool 可以把工作线程控制在固定的数量上,但任务队列是无界的。如果任务较多并且执行较慢的话,队列可能会快速积压,撑爆内存导致 OOM。
如果一直往这个无界队列中添加任务,不久就会出现OOM异常(内存占满):
1 Exception in thread "http-nio-45678-ClientPoller"
2 java.lang.OutOfMemoryError: GC overhead limit exceeded
核心线程数与最大线程数均为1,可用于当锁控制同步。使用的是 LinkedBlockingQueue 无界阻塞队列。
具有时间调度性的线程池,必须初始化核心线程数。
没有最大线程数限制,线程最大空闲时间为0,空闲线程执行完即销毁。底层使用 DelayedWorkQueue 实现延迟特性。
最后,总结一下,从如下的一些方面考虑如何正确地创建线程池。
我们需要根据自己的场景、并发情况来评估线程池的几个核心参数,包括核心线程数、最大线程数、线程回收策略、工作队列的类型,以及拒绝策略,确保线程池的工作行为符合需求,一般都需要设置有界的工作队列和可控的线程数。
要根据任务的“轻重缓急”来指定线程池的核心参数,包括线程数、回收策略和任务队列:
任何时候,都应该为自定义线程池指定有意义的名称,以方便排查问题。当出现线程数量暴增、线程死锁、线程占用大量 CPU、线程执行出现异常等问题时,我们往往会抓取线程栈。此时,有意义的线程名称,就可以方便我们定位问题。
除了建议手动声明线程池以外,还建议用一些监控手段来观察线程池的状态。如果我们能提前观察到线程池队列的积压,或者线程数量的快速膨胀,往往可以提早发现并解决问题。
既然使用了线程池就需要确保线程池是在复用的,每次 new 一个线程池出来可能比不用线程池还糟糕。如果你没有直接声明线程池而是使用其他同学提供的类库来获得一个线程池,请务必查看源码,以确认线程池的实例化方式和配置是符合预期的。
不要盲目复用线程池,别人定义的线程池属性不一定适合你的任务,而且混用会相互干扰。
另外,Java 8 的 parallel stream 背后是共享同一个 ForkJoinPool,默认并行度是 CPU 核数 -1。对于 CPU 绑定的任务来说,使用这样的配置比较合适,但如果集合操作涉及同步 IO 操作的话(比如数据库操作、外部服务调用等),建议自定义一个 ForkJoinPool(或普通线程池)。因此在使用 Java8 的并行流时,建议只用在计算密集型的任务,IO密集型的任务建议自定义线程池来提交任务,避免影响其它业务。
如下是我自己封装的一个线程池工具类,还提供了执行批量任务的方法,关于批量任务后面再单独写篇文章来介绍。
1 package org.hzero.core.util;
2
3 import java.util.ArrayList;
4 import java.util.Collections;
5 import java.util.List;
6 import java.util.concurrent.*;
7 import java.util.stream.Collectors;
8 import javax.annotation.Nonnull;
9
10 import com.google.common.util.concurrent.ThreadFactoryBuilder;
11 import org.apache.commons.collections4.CollectionUtils;
12 import org.apache.commons.lang3.RandomUtils;
13 import org.slf4j.Logger;
14 import org.slf4j.LoggerFactory;
15 import org.springframework.dao.DuplicateKeyException;
16
17 import io.choerodon.core.exception.CommonException;
18
19 import org.hzero.core.base.BaseConstants;
20
21 /**
22 * @author bojiangzhou 2020/02/24
23 */
24 public class CommonExecutor {
25
26 private static final Logger LOGGER = LoggerFactory.getLogger(CommonExecutor.class);
27
28 private static final ThreadPoolExecutor BASE_EXECUTOR;
29
30 static {
31 BASE_EXECUTOR = buildThreadFirstExecutor("BaseExecutor");
32 }
33
34 /**
35 * 构建线程优先的线程池
36 * <p>
37 * 线程池默认是当核心线程数满了后,将任务添加到工作队列中,当工作队列满了之后,再创建线程直到达到最大线程数。
38 *
39 * <p>
40 * 线程优先的线程池,就是在核心线程满了之后,继续创建线程,直到达到最大线程数之后,再把任务添加到工作队列中。
41 *
42 * <p>
43 * 此方法默认设置核心线程数为 CPU 核数,最大线程数为 8倍 CPU 核数,空闲线程超过 5 分钟销毁,工作队列大小为 65536。
44 *
45 * @param poolName 线程池名称
46 * @return ThreadPoolExecutor
47 */
48 public static ThreadPoolExecutor buildThreadFirstExecutor(String poolName) {
49 int coreSize = CommonExecutor.getCpuProcessors();
50 int maxSize = coreSize * 8;
51 return buildThreadFirstExecutor(coreSize, maxSize, 5, TimeUnit.MINUTES, 1 << 16, poolName);
52 }
53
54 /**
55 * 构建线程优先的线程池
56 * <p>
57 * 线程池默认是当核心线程数满了后,将任务添加到工作队列中,当工作队列满了之后,再创建线程直到达到最大线程数。
58 *
59 * <p>
60 * 线程优先的线程池,就是在核心线程满了之后,继续创建线程,直到达到最大线程数之后,再把任务添加到工作队列中。
61 *
62 * @param corePoolSize 核心线程数
63 * @param maximumPoolSize 最大线程数
64 * @param keepAliveTime 空闲线程的空闲时间
65 * @param unit 时间单位
66 * @param workQueueSize 工作队列容量大小
67 * @param poolName 线程池名称
68 * @return ThreadPoolExecutor
69 */
70 public static ThreadPoolExecutor buildThreadFirstExecutor(int corePoolSize,
71 int maximumPoolSize,
72 long keepAliveTime,
73 TimeUnit unit,
74 int workQueueSize,
75 String poolName) {
76 // 自定义队列,优先开启更多线程,而不是放入队列
77 LinkedBlockingQueue<Runnable> queue = new LinkedBlockingQueue<Runnable>(workQueueSize) {
78 private static final long serialVersionUID = 5075561696269543041L;
79
80 @Override
81 public boolean offer(@Nonnull Runnable o) {
82 return false; // 造成队列已满的假象
83 }
84 };
85
86 // 当线程达到 maximumPoolSize 时会触发拒绝策略,此时将任务 put 到队列中
87 RejectedExecutionHandler rejectedExecutionHandler = (runnable, executor) -> {
88 try {
89 // 任务拒绝时,通过 offer 放入队列
90 queue.put(runnable);
91 } catch (InterruptedException e) {
92 LOGGER.warn("{} Queue offer interrupted. ", poolName, e);
93 Thread.currentThread().interrupt();
94 }
95 };
96
97 ThreadPoolExecutor executor = new ThreadPoolExecutor(
98 corePoolSize, maximumPoolSize,
99 keepAliveTime, unit,
100 queue,
101 new ThreadFactoryBuilder()
102 .setNameFormat(poolName + "-%d")
103 .setUncaughtExceptionHandler((Thread thread, Throwable throwable) -> {
104 LOGGER.error("{} catching the uncaught exception, ThreadName: [{}]", poolName, thread.toString(), throwable);
105 })
106 .build(),
107 rejectedExecutionHandler
108 );
109
110 CommonExecutor.displayThreadPoolStatus(executor, poolName);
111 CommonExecutor.hookShutdownThreadPool(executor, poolName);
112 return executor;
113 }
114
115 /**
116 * 批量提交异步任务,使用默认的线程池
117 *
118 * @param tasks 将任务转化为 AsyncTask 批量提交
119 */
120 public static <T> List<T> batchExecuteAsync(List<AsyncTask<T>> tasks, @Nonnull String taskName) {
121 return batchExecuteAsync(tasks, BASE_EXECUTOR, taskName);
122 }
123
124 /**
125 * 批量提交异步任务,执行失败可抛出异常或返回异常编码即可 <br>
126 * <p>
127 * 需注意提交的异步任务无法控制事务,一般需容忍产生一些垃圾数据的情况下才能使用异步任务,异步任务执行失败将抛出异常,主线程可回滚事务.
128 * <p>
129 * 异步任务失败后,将取消剩余的任务执行.
130 *
131 * @param tasks 将任务转化为 AsyncTask 批量提交
132 * @param executor 线程池,需自行根据业务场景创建相应的线程池
133 * @return 返回执行结果
134 */
135 public static <T> List<T> batchExecuteAsync(@Nonnull List<AsyncTask<T>> tasks, @Nonnull ThreadPoolExecutor executor, @Nonnull String taskName) {
136 if (CollectionUtils.isEmpty(tasks)) {
137 return Collections.emptyList();
138 }
139
140 int size = tasks.size();
141
142 List<Callable<T>> callables = tasks.stream().map(t -> (Callable<T>) () -> {
143 try {
144 T r = t.doExecute();
145
146 LOGGER.debug("[>>Executor<<] Async task execute success. ThreadName: [{}], BatchTaskName: [{}], SubTaskName: [{}]",
147 Thread.currentThread().getName(), taskName, t.taskName());
148 return r;
149 } catch (Throwable e) {
150 LOGGER.warn("[>>Executor<<] Async task execute error. ThreadName: [{}], BatchTaskName: [{}], SubTaskName: [{}], exception: {}",
151 Thread.currentThread().getName(), taskName, t.taskName(), e.getMessage());
152 throw e;
153 }
154 }).collect(Collectors.toList());
155
156 CompletionService<T> cs = new ExecutorCompletionService<>(executor, new LinkedBlockingQueue<>(size));
157 List<Future<T>> futures = new ArrayList<>(size);
158 LOGGER.info("[>>Executor<<] Start async tasks, BatchTaskName: [{}], TaskSize: [{}]", taskName, size);
159
160 for (Callable<T> task : callables) {
161 futures.add(cs.submit(task));
162 }
163
164 List<T> resultList = new ArrayList<>(size);
165 for (int i = 0; i < size; i++) {
166 try {
167 Future<T> future = cs.poll(6, TimeUnit.MINUTES);
168 if (future != null) {
169 T result = future.get();
170 resultList.add(result);
171 LOGGER.debug("[>>Executor<<] Async task [{}] - [{}] execute success, result: {}", taskName, i, result);
172 } else {
173 cancelTask(futures);
174 LOGGER.error("[>>Executor<<] Async task [{}] - [{}] execute timeout, then cancel other tasks.", taskName, i);
175 throw new CommonException(BaseConstants.ErrorCode.TIMEOUT);
176 }
177 } catch (ExecutionException e) {
178 LOGGER.warn("[>>Executor<<] Async task [{}] - [{}] execute error, then cancel other tasks.", taskName, i, e);
179 cancelTask(futures);
180 Throwable throwable = e.getCause();
181 if (throwable instanceof CommonException) {
182 throw (CommonException) throwable;
183 } else if (throwable instanceof DuplicateKeyException) {
184 throw (DuplicateKeyException) throwable;
185 } else {
186 throw new CommonException("error.executorError", e.getCause().getMessage());
187 }
188 } catch (InterruptedException e) {
189 cancelTask(futures);
190 Thread.currentThread().interrupt(); // 重置中断标识
191 LOGGER.error("[>>Executor<<] Async task [{}] - [{}] were interrupted.", taskName, i);
192 throw new CommonException(BaseConstants.ErrorCode.ERROR);
193 }
194 }
195 LOGGER.info("[>>Executor<<] Finish async tasks , BatchTaskName: [{}], TaskSize: [{}]", taskName, size);
196 return resultList;
197 }
198
199 /**
200 * 根据一定周期输出线程池的状态
201 *
202 * @param threadPool 线程池
203 * @param threadPoolName 线程池名称
204 */
205 public static void displayThreadPoolStatus(ThreadPoolExecutor threadPool, String threadPoolName) {
206 displayThreadPoolStatus(threadPool, threadPoolName, RandomUtils.nextInt(60, 600), TimeUnit.SECONDS);
207 }
208
209 /**
210 * 根据一定周期输出线程池的状态
211 *
212 * @param threadPool 线程池
213 * @param threadPoolName 线程池名称
214 * @param period 周期
215 * @param unit 时间单位
216 */
217 public static void displayThreadPoolStatus(ThreadPoolExecutor threadPool, String threadPoolName, long period, TimeUnit unit) {
218 Executors.newSingleThreadScheduledExecutor().scheduleAtFixedRate(() -> {
219 LOGGER.info("[>>ExecutorStatus<<] ThreadPool Name: [{}], Pool Status: [shutdown={}, Terminated={}], Pool Thread Size: {}, Active Thread Count: {}, Task Count: {}, Tasks Completed: {}, Tasks in Queue: {}",
220 threadPoolName,
221 threadPool.isShutdown(), threadPool.isTerminated(), // 线程是否被终止
222 threadPool.getPoolSize(), // 线程池线程数量
223 threadPool.getActiveCount(), // 工作线程数
224 threadPool.getTaskCount(), // 总任务数
225 threadPool.getCompletedTaskCount(), // 已完成的任务数
226 threadPool.getQueue().size()); // 线程池中线程的数量
227 }, 0, period, unit);
228 }
229
230 /**
231 * 添加Hook在Jvm关闭时优雅的关闭线程池
232 *
233 * @param threadPool 线程池
234 * @param threadPoolName 线程池名称
235 */
236 public static void hookShutdownThreadPool(ExecutorService threadPool, String threadPoolName) {
237 Runtime.getRuntime().addShutdownHook(new Thread(() -> {
238 LOGGER.info("[>>ExecutorShutdown<<] Start to shutdown the thead pool: [{}]", threadPoolName);
239 // 使新任务无法提交
240 threadPool.shutdown();
241 try {
242 // 等待未完成任务结束
243 if (!threadPool.awaitTermination(60, TimeUnit.SECONDS)) {
244 threadPool.shutdownNow(); // 取消当前执行的任务
245 LOGGER.warn("[>>ExecutorShutdown<<] Interrupt the worker, which may cause some task inconsistent. Please check the biz logs.");
246
247 // 等待任务取消的响应
248 if (!threadPool.awaitTermination(60, TimeUnit.SECONDS)) {
249 LOGGER.error("[>>ExecutorShutdown<<] Thread pool can‘t be shutdown even with interrupting worker threads, which may cause some task inconsistent. Please check the biz logs.");
250 }
251 }
252 } catch (InterruptedException ie) {
253 // 重新取消当前线程进行中断
254 threadPool.shutdownNow();
255 LOGGER.error("[>>ExecutorShutdown<<] The current server thread is interrupted when it is trying to stop the worker threads. This may leave an inconsistent state. Please check the biz logs.");
256
257 // 保留中断状态
258 Thread.currentThread().interrupt();
259 }
260
261 LOGGER.info("[>>ExecutorShutdown<<] Finally shutdown the thead pool: [{}]", threadPoolName);
262 }));
263 }
264
265 /**
266 * 获取返回CPU核数
267 *
268 * @return 返回CPU核数,默认为8
269 */
270 public static int getCpuProcessors() {
271 return Runtime.getRuntime() != null && Runtime.getRuntime().availableProcessors() > 0 ?
272 Runtime.getRuntime().availableProcessors() : 8;
273 }
274
275 private static <T> void cancelTask(List<Future<T>> futures) {
276 for (Future<T> future : futures) {
277 if (!future.isDone()) {
278 future.cancel(true);
279 }
280 }
281 }
282
283 }
AsyncTask:
1 package org.hzero.core.util;
2
3 import java.util.UUID;
4
5 public interface AsyncTask<T> {
6
7 default String taskName() {
8 return UUID.randomUUID().toString();
9 }
10
11 T doExecute();
12 }
--------------------------------------------------------------------------------------------------------------
原文:https://www.cnblogs.com/chiangchou/p/thread-pool.html