ArrayList中的sort排序

ArrayList中有一个sort排序方法,只要你实现了Comparator的接口,按照你自己的排序业务进行实现,你只要告诉这个接口按照什么类型进行排序就OK了。这种方式类似于设计模式中的策略模式,把流程划分好,具体的业务逻辑由用户指定。这时候我们需要带着问题去看看里面具体是如何实现的..

环境描述

JDK : 1.8

伪代码:

 public static void main(String[] args) {
        // 初始化一组数据,这组数据可以是任意对象
        int[] data = {7, 5, 1, 2, 6, 8, 10, 12, 4, 3, 9, 11, 13, 15, 16, 14}; 
        // 构建成一个集合
        List<Integer> list = new ArrayList<>();
        for (int i = 0; i < data.length; i++) {
            list.add(data[i]);
        }
        // 设定自己的比较方式
        // 1顺序 -1倒序
        list.sort(new Comparator<Integer>() {
            @Override
            public int compare(Integer o1, Integer o2) {
                int i = o1 > o2 ? 1 : -1;
                System.out.println("开始比较 [o1] - " + o1 + "\t [o2] - " + o2);
                return i;
            }
        });
        // 打印结果
        System.out.println(JSON.toJSONString(list));
    }

问题

  • 它是如何实现的 ?

实践

跟踪代码

  1. ArrayList中的 sort方法
public void sort(Comparator<? super E> c) {
        // 集合大小
        final int expectedModCount = modCount;
        // 将排序交给Arrays去实现
        Arrays.sort((E[]) elementData, 0, size, c);
        if (modCount != expectedModCount) {
            throw new ConcurrentModificationException();
        }
        modCount++;
    }
  1. Arrays中的sort方法又是交给一个TimSort类去实现的,我们直接看TimSort类的sort方法

    static <T> void sort(T[] a, int lo, int hi, Comparator<? super T> c,
                         T[] work, int workBase, int workLen) {
        assert c != null && a != null && lo >= 0 && lo <= hi && hi <= a.length;

        int nRemaining  = hi - lo;
        // 这里表示如果大小小于2则没有排序的必要了
        if (nRemaining < 2)
            return;  // Arrays of size 0 and 1 are always sorted

        // If array is small, do a "mini-TimSort" with no merges
        // 这里会根据数组的大小来使用不同的排序方式
        // 默认的如果大小不超过32则会采用归并排序
        if (nRemaining < MIN_MERGE) {
            // 这里面会根据你数组中数据是递增还是递减的方式来划分成两块
            // 举例   1,4,7,3,6,2 这里一开始是递增直到7结束,如果比较方法得出的的值是-1(递减),
            //则会将1,4,7先进行反转得到 7,4,1 然后划分成两个逻辑部分{7,4,1} , {3,6,2} 进行归并运算
            // 这里的返回值得到的就是划分成两部分的下标索引比如上面举例的就是3
            int initRunLen = countRunAndMakeAscending(a, lo, hi, c);
            // 归并排序
            binarySort(a, lo, hi, lo + initRunLen, c);
            return;
        }


//////////////////////////////////// 这里是数组长度大于32的情况下 //////////////////////////////////////////
        /**
         * March over the array once, left to right, finding natural runs,
         * extending short natural runs to minRun elements, and merging runs
         * to maintain stack invariant.
         */
        TimSort<T> ts = new TimSort<>(a, c, work, workBase, workLen);
        // 得到一个最小的归并长度,根据这个长度来判断这组数据具体要归并几次
        int minRun = minRunLength(nRemaining);
        do {
            // Identify next run
            int runLen = countRunAndMakeAscending(a, lo, hi, c);

            // If run is short, extend to min(minRun, nRemaining)
            if (runLen < minRun) {
                int force = nRemaining <= minRun ? nRemaining : minRun;
                binarySort(a, lo, lo + force, lo + runLen, c);
                //运行长度
                runLen = force;
            }

            // Push run onto pending-run stack, and maybe merge
            // 将运行下标进行记录
            ts.pushRun(lo, runLen);
            ts.mergeCollapse();

            // Advance to find next run
            lo += runLen;
            nRemaining -= runLen;
        } while (nRemaining != 0);

        // Merge all remaining runs to complete sort
        assert lo == hi;
        ts.mergeForceCollapse();
        assert ts.stackSize == 1;
    }


 
private static <T> int countRunAndMakeAscending(T[] a, int lo, int hi,
                                                    Comparator<? super T> c) {
        assert lo < hi;
        // 得到下一个坐标
        int runHi = lo + 1;
        // 如果都等于1 
        if (runHi == hi)
            return 1;

        // Find end of run, and reverse range if descending
        //找到运行结束,如果下降,反向范围
        // 这里面会根据你数组中数据是递增还是递减的方式来划分成两块
        // 举例   1,4,7,3,6,2 这里一开始是递增直到7结束,如果比较方法得出的的值是-1(递减),
        //则会将1,4,7先进行反转得到 7,4,1 然后划分成两个逻辑部分{7,4,1} , {3,6,2} 进行归并运算
        if (c.compare(a[runHi++], a[lo]) < 0) { // Descending
            while (runHi < hi && c.compare(a[runHi], a[runHi - 1]) < 0)
                runHi++;
            reverseRange(a, lo, runHi);
        } else {                              // Ascending
            while (runHi < hi && c.compare(a[runHi], a[runHi - 1]) >= 0)
                runHi++;
        }

        return runHi - lo;
    }

// 具体的归并排序
private static <T> void binarySort(T[] a, int lo, int hi, int start,
                                       Comparator<? super T> c) {
        assert lo <= start && start <= hi;
        if (start == lo)
            start++;

      // 这里的start 是等于上面划分的临界点的值,比如上面举例的就是3,从3的下标值开始和一部分进行比较
        for ( ; start < hi; start++) {
            T pivot = a[start];

            // Set left (and right) to the index where a[start] (pivot) belongs
            // 左边就相当于 {7,4,1}的下标,默认是0
            int left = lo;
            // 右边就相当于{3,6,2}
            int right = start;
            assert left <= right;
            /*
             * Invariants:
             *   pivot >= all in [lo, left).
             *   pivot <  all in [right, start).
             */
            // 找归并位置,必须左边小于右边
            while (left < right) {
                // 运算方式 , 你可以理解成 count / 2 得到的整数
                int mid = (left + right) >>> 1;
                // 如果小于0则改变right的位置
                if (c.compare(pivot, a[mid]) < 0)
                    right = mid;
                else
                // 如果大于 则改变left值,
                    left = mid + 1;
            }
            // 直到相等,表示找到了该值应该落在的区间
            assert left == right;

            /*
             * The invariants still hold: pivot >= all in [lo, left) and
             * pivot < all in [left, start), so pivot belongs at left.  Note
             * that if there are elements equal to pivot, left points to the
             * first slot after them -- that's why this sort is stable.
             * Slide elements over to make room for pivot.
             */
          // 这里是算出要移动的区间长度,如果区间长度在2以内,则交换一下位置就兴了,如果大于2,则采用数据复制移动的方式
            int n = start - left;  // The number of elements to move
            // Switch is just an optimization for arraycopy in default case
            switch (n) {
                case 2:  a[left + 2] = a[left + 1];
                case 1:  a[left + 1] = a[left];
                         break;
                default: System.arraycopy(a, left, a, left + 1, n);
            }
            // 最后将右边预算的值,填充的合适的区间内
            a[left] = pivot;
        }
    }

画图理解一下:

  1. 初始化数组:


    image.png
  2. 通过countRunAndMakeAscending方法,得到数据的走势,是递增还是递减,逻辑上划分成了两个数组,划分值是下标值3


    image.png
  3. 循环B中的数据与A做归并,这时候是从下标3开始,进行运算
    运算流程:

     开始从第三个进行 , 这时候会定义三个变量 : 
           1. left 最左边开始移动的数
           2. right 最右边开始移动数
           3.start 开始移动数
    
     初始化值:
       left = 0;
       right = 3;
       start = 3;
    
       移动的运算公式
       int mid = (left + right) >>> 1 ; // 这里可以看作是 移动后的值/2
    
       循环运算条件 : left < right
    
       第一次运算:
       mid = 1; // 1的下标值是5.
       // 2 > 5 ? 决定是改变left还是right..  这时候是改变right ,
       right = mid; // 这时候right = 1; left = 0; 
    
       //循环条件满足
    
       第二次运算:
       1. 1>>>1 = 0  // 0的下标值是1
       mid = 0;
       // 2 > 1 ? 这时候改变的是left 
       left = mid + 1; // 这时候left = 1;
    
       不会再做第三次运算了,因为循环条件已经不满足了,现在值是 1 > 1 了 这时候开始进行下一步,值移动
    
    
       int n = start - left; // n = 3  - 1 =2 表示要移动2个值
       
        switch (n) {
             case 2:  a[left + 2] = a[left + 1];
             case 1:  a[left + 1] = a[left];
                      break;
             default: System.arraycopy(a, left, a, left + 1, n);
         }
         // 最后将运算的值,填充的合适的区间内
         a[left] = pivot;
    

    这时候我们看到的"大概"流程:

    1. 7 移动到2的位置
    2. 5移动到7的位置
    3. 5的位置由pivot代替,开始循环的变量值,不懂可以去看上面的代码


      image.png

然后开始下一个值的轮询,一直到B组中的数据全部在A中找到对应的区间,完成排序.

总结

  1. ArrayList中的sort排序是采用归并排序的。
    [一个数组的值的趋势(增长或者减少)打断的地方开始划分]
  2. 当数组中的数据非常大的时候,会采用几次归并来完成排序.具体采用几次归并是minRunLength(nRemaining);方法去计算的.
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容