高效率的集合交集（差集）处理方式

我们在业务上难免会遇到集合交集的处理，这边总结了几种方式比较，然后寻求最优的方式。当然如果集合数据比较少的情况下，选取的方式基本都能满足需求，但是如果在数据量比较大的情况下呢？如果选取的方式不好，那么效率就会及其的低下。下面我们就集中方式展开分析。

ArrayList原生接口retainAll(c)方式

    public static void main(String[] args) {
        
        List<String> list1 = new ArrayList<String>();
        List<String> list2 = new ArrayList<String>();
        List<String> r = new ArrayList<>();
        // 初始化数据
        for (int i = 0; i < 30000; i++) {
            list1.add("test" + i);
            list2.add("test" + i * 3);
        }
        System.out.println("添加完成");
        long t = System.currentTimeMillis();
        list1.retainAll(list2);
        System.out.println(System.currentTimeMillis() - t);
    }

我们执行上述代码，我们一个集合3w的数据，耗时时间基本都是在9s左右。

通过list遍历contains判定方式

  public static void main(String[] args) {


        List<String> list1 = new ArrayList<String>();
        List<String> list2 = new ArrayList<String>();
        List<String> r = new ArrayList<>();
        for (int i = 0; i < 30000; i++) {
            list1.add("test" + i);
            list2.add("test" + i * 3);
        }
        System.out.println("添加完成");
        long t = System.currentTimeMillis();

        list1.stream().forEach(s->{
            if(list2.contains(s)){
                r.add(s);
            }
        });

        System.out.println(System.currentTimeMillis() - t);

    }

跟原生api的方式比较，效率差不多，通过代码分析，原生api也是采用的是集合遍历然后contains判定的。

List转Map通过key来判定是否交叉

public static void main(String[] args) {


        List<String> list1 = new ArrayList<String>();
        List<String> list2 = new ArrayList<String>();
        List<String> r = new ArrayList<>();
        for (int i = 0; i < 30000; i++) {
            list1.add("test" + i);
            list2.add("test" + i * 3);
        }
        System.out.println("添加完成");
        long t = System.currentTimeMillis();


        Map<String, String> map1 = list1.stream().collect(toMap(s -> s, Function.<String>identity()));
        list2.stream().forEach(s -> {
            String ss = map1.get(s);
            if (ss != null) {
                r.add(ss);
            }
        });

        System.out.println(System.currentTimeMillis() - t);
    }

执行代码跟上面两种方式相比，效率是相当的高，两个数组都在3W级别的数量集，基本保持在100ms左右即可完成。

最后编辑于：2020.12.11 17:12:51

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

高效率的集合交集（差集）处理方式

高效率的集合交集（差集）处理方式

相关阅读更多精彩内容

友情链接更多精彩内容