Colletions.sort 和 Arrays.sort 的算法

Java 容器 & 泛型:四、Colletions.sort 和 Arrays.sort 的算法

Writer:BYSocket(泥沙砖瓦浆木匠)

https://www.cnblogs.com/Alandre/p/4437720.html

微博:BYSocket

豆瓣:BYSocket

本来准备讲 Map集合 ,还是喜欢学到哪里总结吧。最近面试期准备准备,我是一员,成功被阿里在线笔试秒杀回绝。平常心,继续努力。这次带来 Collections 和 Arrays 类中的经典算法剖析。


一、Colletions和Arrays

Collentions 此类完全是服务容器的”包装器“。提供了一些操作或者返回容器的静态方法。而Arrays是用来操作数组的各种方法。其中它们的联系在于其中的Sort方法,也就是这次博客的主题。


二、插入,快速、归并基本算法

① 插入排序

{a1},{a2,a3,a4,…,an}}

{{a1⑴,a2⑴},{a3⑴,a4⑴ …,an⑴}}

{{a1(n-1),a2(n-1) ,…},{an(n-1)}}

原理及记忆方法:每次处理就是将无序数列的第一个元素与有序数列的元素从后往前逐个进行比较,找出插入位置,将该元素插入到有序数列的合适位置中。这通俗的是找座位思想。Java版实现如下


import java.util.Arrays;


public class InsertionSort

{

    public static void main(String[] args)

    {

        int[] intA = new int[]{2,1,3,4,6,7,5};

        System.out.println(Arrays.toString(intA));

        insertionSort(intA);

        System.out.println(Arrays.toString(intA));

    }


    public static void insertionSort(int[] a)

    {

        int p,right;

        int temp;

        for (p = 0; p < a.length; p++)

        {

            temp = a[p];

            /**

             * 将a[p]值往左侧有序列比较,插入。

             */

            for (right = p; right > 0 && a[right-1] > temp ; right--)

                a[right] = a[right-1];// 置换

            a[right] = temp;

        }

    }

}

右键,run一下可以看到控制台结果:


[2, 1, 3, 4, 6, 7, 5]

[1, 2, 3, 4, 5, 6, 7]


② 快速排序

快排是基于分治策略的算法,不是一种稳定的排序算法,也就是说,多个相同的值的相对位置也许会在算法结束时产生变动。 Java版实现如下:


package javaBasic.algorithm;


import java.util.Arrays;


public class QuickSort

{

    public static void main(String[] args)

    {

        int[] intA = new int[]{2,1,3,4,6,7,5};

        System.out.println(Arrays.toString(intA));

        //middleSort(intA, 0, intA.length - 1);

        //System.out.println(Arrays.toString(intA));

        sort(intA, 0, intA.length - 1);

        System.out.println(Arrays.toString(intA));

    }


    // 快速排序中的一个划分过程

    public static int  middleSort(int a[] , int left , int right)

    {

        int temp = a[left]; // 作为中间轴数

        while( left  < right)

        {

            /**

             * 从右到左,找到第一个比中间轴数小的,移到左端

             */

            while( left < right && a[right] > temp )

                right--;

            a[left] = a[right];


            /**

             * 从左到右,找到第一个比中间轴数大的,移到右端

             */

            while( left < right && a[left] < temp)

                left++;

            a[right] = a[left];

        }


        /**

         * 将中间轴数赋值

         */

        a[left] = temp;

        return left;

    }


    // 快速排序

    public static void sort(int[] a , int left, int right)

    {

        if (left < right)

        {

            /**

             * 根据左右索引相同才停止。

             * 不同的话,按着分治思想。

             * 找到中间轴数,一分为二,以此类推。

             */

            int middle = middleSort(a, left, right);

            sort(a, left, middle - 1);

            sort(a, middle + 1, right);

        }

    }


}

记忆方法:分治,就是分工。这里演示的是对分。大量经验数据表面,采用两个枢轴来划分成3份的算法更高效,这就是DualPivotQuicksort。这样也是我们后面讲的JDK源码。右键,run一下可以看到控制台和插入排序一样的结果。

③ 归并排序

如图,来自百度百科。归并排序也是一种分治思想的算法,之不用快速是对分。归并是一种分解到合并的算法。如下实现方式:


package javaBasic.algorithm;


import java.util.Arrays;


public class MergeSort

{

    public static void main(String[] args)

    {

        int[] intA = new int[]{10,4,6,3,8,2,5,7};

        System.out.println(Arrays.toString(intA));

        mergeSort(intA,0,intA.length-1);

        System.out.println(Arrays.toString(intA));

    }


    public static void mergeSort(int[] a, int left ,int right)

    {

        if (left < right)

        {

            int middle = (left + right) / 2; // 中间索引


            mergeSort(a, left, middle); // 对左侧数组递归

            mergeSort(a, middle+1, right); // 对右侧数组递归


            merge(a,left,middle,right); // 归并算法

        }

    }


    private static void merge(int[] a, int left, int middle, int right)

    {

        int [] tmpArr = new int[a.length];


        int mid = middle+1;

        int tmpArrLeft = left;// 记录左侧数组的索引

        int tmpLeft = left;


        /**

         * 从两个数组中取出小的一部分复制

         */

        while (left <= middle && mid <= right)

        {

            if (a[left] <= a[mid])

                tmpArr[tmpArrLeft++] = a[left++];

            else

                tmpArr[tmpArrLeft++] = a[mid++];

        }


        /**

         * 剩余部分右侧复制

         */

        while (mid <= right)

        {

            tmpArr[tmpArrLeft++] = a[mid++];

        }


        /**

         * 剩余部分左侧复制

         */

        while (left <= middle)

        {

            tmpArr[tmpArrLeft++] = a[left++];

        }


        /**

         * 分了再合

         */

        while(tmpLeft <= right)

        {

            a[tmpLeft] = tmpArr[tmpLeft++];

        }

    }


}

结果和上图一样:


[10, 4, 6, 3, 8, 2, 5, 7]

[2, 3, 4, 5, 6, 7, 8, 10]


三、JDK数则

在此谢谢@江南白衣大哥的文章,对我帮助很大。以下引用的:


5. JDK7/8中排序算法的改进

面试季的同学背一脑袋的插入、归并、冒泡、快排,那,JDK到底看上了哪家的排序算法?


Colletions.sort(list) 与 Arrays.sort(T[])

Colletions.sort()实际会将list转为数组,然后调用Arrays.sort(),排完了再转回List。

而Arrays.sort(),对原始类型(int[],double[],char[],byte[]),JDK6里用的是快速排序,对于对象类型(Object[]),JDK6则使用归并排序。为什么要用不同的算法呢?


JDK7的进步

到了JDK7,快速排序升级为双基准快排(双基准快排 vs 三路快排);归并排序升级为归并排序的改进版TimSort,一个JDK的自我进化。


JDK8的进步

再到了JDK8, 对大集合增加了Arrays.parallelSort()函数,使用fork-Join框架,充分利用多核,对大的集合进行切分然后再归并排序,而在小的连续片段里,依然使用TimSort与DualPivotQuickSort。


结论

JDK团队的努力,从一些简单的New Features / Change List 根本看不到,所以没事升级一下JDK还是好的


我也查看了关于算法追踪到DualPivotQuicksort类,但是这类却不在JDK API。(抛出个问题:为什么这个类不出现在API里面?)哈哈,一看作者是Java之父参与写的,瞬间有研究的激情。根据白衣大哥说的,快速排序由双基准排序到三路快速排序。这也是在大量经验数据表面,采用两个枢轴来划分成3份的算法更高效。算法的思想也是分治思想。

下面又看到了一段发人自省的注释:


/**

    * If the length of an array to be sorted is less than this

    * constant, Quicksort is used in preference to merge sort.

    *  当数组长度小于286,为什么快速排序比归并排序好?

    */

   private static final int QUICKSORT_THRESHOLD = 286;


   /**

    * If the length of an array to be sorted is less than this

    * constant, insertion sort is used in preference to Quicksort.

    * 当数组长度小于47,为什么插入排序比快速排序好?

    */

   private static final int INSERTION_SORT_THRESHOLD = 47;


为什么?第二个问题,欢迎大神解答。

我的理解:第一,建立在大量经验数据结果。第二,根据算法时间复杂度和空间复杂度。至于深入了解需要大神解答。

JDK排序顺序图如下:


Writer:BYSocket(泥沙砖瓦浆木匠)

双击快排:为避免重复元素过多

三路:分三个区间,大于临界支点,等于零界支点,小于零界支点

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356

推荐阅读更多精彩内容

  • 排序的分类可以分为两种:内排序和外排序。 在排序过程中,全部记录放在内存,则称为内排序,如果排序过程中要使用外村,...
    親愛的破小孩阅读 1,126评论 0 1
  • 数据结构 Java中的数组有差不多一样的语法。只是java中处理8种基本类型,数组也是作为对象处理的,所以创建对...
    赵宇_阿特奇阅读 713评论 0 0
  • 她吃着我的饭, 她穿着我的衣, 她睡着我的觉, 她做着我的梦, 她上着我的学, 她读着我的书, 她谈着我的恋, 她...
    油腻司机阅读 237评论 0 0
  • 你觉得共享单车的商业模式是什么?共享单车之战,谁才是最终的王者? 【头脑风暴】 【1】共享经济,一般是指以获得一定...
    兜兜趣多多阅读 281评论 0 0