浅谈Java的Fork/Join并发框架

简介:



前几天有写到整合并发结果的文章,于是联想到了Fork/Join。因为在我看来整合并发结果其实就是Fork/Join中的Join步骤。所以今天我就把自己对Fork/Join一些浅显的理解记录下来。

1. Fork/Join是什么

Oracle的官方给出的定义是:Fork/Join框架是一个实现了ExecutorService接口的多线程处理器。它可以把一个大的任务划分为若干个小的任务并发执行,充分利用可用的资源,进而提高应用的执行效率。

Fork/Join实现了ExecutorService,所以它的任务也需要放在线程池中执行。它的不同在于它使用了工作窃取算法,空闲的线程可以从满负荷的线程中窃取任务来帮忙执行。(我个人理解的工作窃取大意就是:由于线程池中的每个线程都有一个队列,而且线程间互不影响。那么线程每次都从自己的任务队列的头部获取一个任务出来执行。如果某个时候一个线程的任务队列空了,而其余的线程任务队列中还有任务,那么这个线程就会从其他线程的任务队列中取一个任务出来帮忙执行。就像偷取了其他人的工作一样)

Fork/Join框架的核心是继承了AbstractExecutorService的ForkJoinPool类,它保证了工作窃取算法和ForkJoinTask的正常工作。

下面是引用Oracle官方定义的原文:

The fork/join framework is an implementation of the ExecutorService interface that helps you take advantage of multiple processors. It is designed for work that can be broken into smaller pieces recursively. The goal is to use all the available processing power to enhance the performance of your application.

As with any ExecutorService implementation, the fork/join framework distributes tasks to worker threads in a thread pool. The fork/join framework is distinct because it uses a work-stealing algorithm. Worker threads that run out of things to do can steal tasks from other threads that are still busy.

The center of the fork/join framework is the ForkJoinPool class, an extension of the AbstractExecutorService class. ForkJoinPool implements the core work-stealing algorithm and can execute ForkJoinTask processes.

2. Fork/Join的基本用法

(1)Fork/Join基类

上文已经提到,Fork/Join就是要讲一个大的任务分割成若干小的任务,所以第一步当然是要做任务的分割,大致方式如下:

 
  1. if (这个任务足够小){ 
  2.   执行要做的任务 
  3. else { 
  4.   将任务分割成两小部分 
  5.   执行两小部分并等待执行结果 
  6. }  

要实现FrokJoinTask我们需要一个继承了RecursiveTask或RecursiveAction的基类,并根据自身业务情况将上面的代码放入基类的coupute方法中。RecursiveTask和RecursiveAction都继承了FrokJoinTask,它俩的区别就是RecursiveTask有返回值而RecursiveAction没有。下面是我做的一个选出字符串列表中还有"a"的元素的Demo:

 
  1. @Override 
  2.    protected List<String> compute() { 
  3.        // 当end与start之间的差小于阈值时,开始进行实际筛选 
  4.        if (end - this.start < threshold) { 
  5.            List<String> temp = list.subList(this.start, end); 
  6.            return temp.parallelStream().filter(s -> s.contains("a")).collect(Collectors.toList()); 
  7.        } else { 
  8.            // 如果当end与start之间的差大于阈值时 
  9.            // 将大任务分解成两个小任务。 
  10.            int middle = (this.start + end) / 2; 
  11.            ForkJoinTest left = new ForkJoinTest(list, this.start, middle, threshold); 
  12.            ForkJoinTest right = new ForkJoinTest(list, middle, end, threshold); 
  13.            // 并行执行两个“小任务” 
  14.            left.fork(); 
  15.            right.fork(); 
  16.            // 把两个“小任务”的结果合并起来 
  17.            List<String> join = left.join(); 
  18.            join.addAll(right.join()); 
  19.            return join
  20.        } 
  21.    }  

(2)执行类

做好了基类就可以开始调用了,调用时首先我们需要Fork/Join线程池ForkJoinPool,然后向线程池中提交一个ForkJoinTask并得到结果。ForkJoinPool的submit方法的入参是一个ForkJoinTask,返回值也是一个ForkJoinTask,它提供一个get方法可以获取到执行结果。

代码如下:

 
  1. ForkJoinPool pool = new ForkJoinPool(); 
  2.         // 提交可分解的ForkJoinTask任务 
  3.         ForkJoinTask<List<String>> future = pool.submit(forkJoinService); 
  4.         System.out.println(future.get()); 
  5.         // 关闭线程池 
  6.         pool.shutdown();  

就这样我们就完成了一个简单的Fork/Join的开发。

提示:Java8中java.util.Arrays的parallelSort()方法和java.util.streams包中封装的方法也都用到了Fork/Join。(细心的读者可能注意到我在Fork/Join中也有用到stream,所以其实这个Fork/Join是多余的,因为stream已经实现了Fork/Join,不过这只是一个Demo展示,没有任何实际用处也就无所谓了)

引用官方原文:

One such implementation, introduced in Java SE 8, is used by the java.util.Arrays class for its parallelSort() methods. These methods are similar to sort(), but leverage concurrency via the fork/join framework. Parallel sorting of large arrays is faster than sequential sorting when run on multiprocessor systems.

Another implementation of the fork/join framework is used by methods in the java.util.streams package, which is part of Project Lambda scheduled for the Java SE 8 release.

附完整代码以便以后参考:

1. 定义抽象类(用于拓展,此例中没有实际作用,可以不定义此类):

 
  1. import java.util.concurrent.RecursiveTask; 
  2.  
  3. /** 
  4.  * Description: ForkJoin接口 
  5.  * Designer: jack 
  6.  * Date: 2017/8/3 
  7.  * Version: 1.0.0 
  8.  */ 
  9. public abstract class ForkJoinService<T> extends RecursiveTask<T>{ 
  10.     @Override 
  11.     protected abstract T compute(); 
  12. }  

2. 定义基类

 
  1. import java.util.List; 
  2. import java.util.stream.Collectors; 
  3.  
  4. /** 
  5.  * Description: ForkJoin基类 
  6.  * Designer: jack 
  7.  * Date: 2017/8/3 
  8.  * Version: 1.0.0 
  9.  */ 
  10. public class ForkJoinTest extends ForkJoinService<List<String>> { 
  11.  
  12.     private static ForkJoinTest forkJoinTest; 
  13.     private int threshold;  //阈值 
  14.     private List<String> list; //待拆分List 
  15.  
  16.     private ForkJoinTest(List<String> list, int threshold) { 
  17.         this.list = list; 
  18.         this.threshold = threshold; 
  19.     } 
  20.  
  21.     @Override 
  22.     protected List<String> compute() { 
  23.         // 当end与start之间的差小于阈值时,开始进行实际筛选 
  24.         if (list.size() < threshold) { 
  25.             return list.parallelStream().filter(s -> s.contains("a")).collect(Collectors.toList()); 
  26.         } else { 
  27.             // 如果当end与start之间的差大于阈值时,将大任务分解成两个小任务。 
  28.             int middle = list.size() / 2; 
  29.             List<String> leftList = list.subList(0, middle); 
  30.             List<String> rightList = list.subList(middle, list.size()); 
  31.             ForkJoinTest left = new ForkJoinTest(leftList, threshold); 
  32.             ForkJoinTest right = new ForkJoinTest(rightList, threshold); 
  33.             // 并行执行两个“小任务” 
  34.             left.fork(); 
  35.             right.fork(); 
  36.             // 把两个“小任务”的结果合并起来 
  37.             List<String> join = left.join(); 
  38.             join.addAll(right.join()); 
  39.             return join
  40.         } 
  41.     } 
  42.  
  43.     /** 
  44.      * 获取ForkJoinTest实例 
  45.      * @param list  待处理List 
  46.      * @param threshold 阈值 
  47.      * @return ForkJoinTest实例 
  48.      */ 
  49.     public static ForkJoinService<List<String>> getInstance(List<String> list, int threshold) { 
  50.         if (forkJoinTest == null) { 
  51.             synchronized (ForkJoinTest.class) { 
  52.                 if (forkJoinTest == null) { 
  53.                     forkJoinTest = new ForkJoinTest(list, threshold); 
  54.                 } 
  55.             } 
  56.         } 
  57.         return forkJoinTest; 
  58.     } 
  59. }  

3. 执行类

 
  1. import java.util.ArrayList; 
  2. import java.util.Arrays; 
  3. import java.util.List; 
  4. import java.util.concurrent.ExecutionException; 
  5. import java.util.concurrent.ForkJoinPool; 
  6. import java.util.concurrent.ForkJoinTask; 
  7.  
  8. /** 
  9.  * Description: Fork/Join执行类 
  10.  * Designer: jack 
  11.  * Date: 2017/8/3 
  12.  * Version: 1.0.0 
  13.  */ 
  14. public class Test { 
  15.  
  16.     public static void main(String args[]) throws ExecutionException, InterruptedException { 
  17.  
  18.         String[] strings = {"a""ah""b""ba""ab""ac""sd""fd""ar""te""se""te"
  19.                 "sdr""gdf""df""fg""gh""oa""ah""qwe""re""ty""ui"}; 
  20.         List<String> stringList = new ArrayList<>(Arrays.asList(strings)); 
  21.  
  22.         ForkJoinPool pool = new ForkJoinPool(); 
  23.         ForkJoinService<List<String>> forkJoinService = ForkJoinTest.getInstance(stringList, 20); 
  24.         // 提交可分解的ForkJoinTask任务 
  25.         ForkJoinTask<List<String>> future = pool.submit(forkJoinService); 
  26.         System.out.println(future.get()); 
  27.         // 关闭线程池 
  28.         pool.shutdown(); 
  29.  
  30.     } 
  31.  
  32. }  



作者:珂jack

来源:51CTO



相关文章
|
29天前
|
算法 Java 数据处理
Java集合框架的优缺点
Java集合框架的优缺点
|
2天前
|
Java 开发者
Java中多线程并发控制的实现与优化
【4月更文挑战第17天】 在现代软件开发中,多线程编程已成为提升应用性能和响应能力的关键手段。特别是在Java语言中,由于其平台无关性和强大的运行时环境,多线程技术的应用尤为广泛。本文将深入探讨Java多线程的并发控制机制,包括基本的同步方法、死锁问题以及高级并发工具如java.util.concurrent包的使用。通过分析多线程环境下的竞态条件、资源争夺和线程协调问题,我们提出了一系列实现和优化策略,旨在帮助开发者构建更加健壮、高效的多线程应用。
3 0
|
3天前
|
存储 缓存 安全
Java并发基础之互斥同步、非阻塞同步、指令重排与volatile
在Java中,多线程编程常常涉及到共享数据的访问,这时候就需要考虑线程安全问题。Java提供了多种机制来实现线程安全,其中包括互斥同步(Mutex Synchronization)、非阻塞同步(Non-blocking Synchronization)、以及volatile关键字等。 互斥同步(Mutex Synchronization) 互斥同步是一种基本的同步手段,它要求在任何时刻,只有一个线程可以执行某个方法或某个代码块,其他线程必须等待。Java中的synchronized关键字就是实现互斥同步的常用手段。当一个线程进入一个synchronized方法或代码块时,它需要先获得锁,如果
21 0
|
4天前
|
Java 大数据 云计算
Spring框架:Java后台开发的核心
【4月更文挑战第15天】Spring框架在Java后台开发中占据核心位置,因其控制反转(IoC)、面向切面编程(AOP)、事务管理等特性提升效率和质量。Spring提供数据访问集成、RESTful Web服务和WebSocket支持。优势包括高效开发、灵活扩展、强大生态圈和广泛应用。应用于企业级应用、微服务架构及云计算大数据场景。掌握Spring对Java开发者至关重要。
|
7天前
|
存储 Java 编译器
Java集合丛林:深入了解集合框架的秘密
Java集合丛林:深入了解集合框架的秘密
13 0
Java集合丛林:深入了解集合框架的秘密
|
11天前
|
存储 Java 数据库连接
java使用mp持久化框架,写入5000个字符,但是VARCHAR(255) 会报错
使用Java的MyBatis Plus框架时,如果尝试将超过VARCHAR(255)限制的字符串(如5000个字符)存入数据库,会抛出异常。解决方法是将列类型改为TEXT。可通过在实体类属性上添加`@TableField(typeHandler = JdbcType.CLOB)`注解,如`private String content;`,将属性映射到CLOB类型列,以存储更长字符串。
9 0
|
11天前
|
存储 Java
java反射——设计框架的灵魂
java反射——设计框架的灵魂
|
11天前
|
存储 缓存 安全
【企业级理解】高效并发之Java内存模型
【企业级理解】高效并发之Java内存模型
|
16天前
|
前端开发 安全 Java
使用Java Web框架:Spring MVC的全面指南
【4月更文挑战第3天】Spring MVC是Spring框架的一部分,用于构建高效、模块化的Web应用。它基于MVC模式,支持多种视图技术。核心概念包括DispatcherServlet(前端控制器)、HandlerMapping(请求映射)、Controller(处理请求)、ViewResolver(视图解析)和ModelAndView(模型和视图容器)。开发流程涉及配置DispatcherServlet、定义Controller、创建View、处理数据、绑定模型和异常处理。
使用Java Web框架:Spring MVC的全面指南
|
18天前
|
Java 关系型数据库 数据库连接
52 类 110 个常用 Java 组件和框架整理
52 类 110 个常用 Java 组件和框架整理
13 0