第三周上:MergeSort

3.1 MergeSort

Mergesort: java sort for objects

1. Merge sort(recursive,top-down)

  1. 思路:

    • 将array对半分
    • 递归地(recursively)将每一半各自排序
    • 再将这两半合并
      • 复制一个aux[]
      • 两个已排序的subarray: aux[lo] ~ aux[mid]aux[mid+1] ~ aux[hi]
      • 分别设index:i、j,aux[i], aux[j]比大小,取小的复制回a[];若相等,将aux[i]复制回a[]
  2. Performance (size N):

    • worst case: NlgN compares, 6NlgN array accesses
    • best case (input array is sorted): ~\frac{1}{2}NlgN
      • optimized version (也就是在sort()函数中多加一行代码,即优化2:a[mid]<=a[mid+1]):N-1 compares
  • Complexity:
    • 考虑compares次数:Mergesort is optimal
    • 考虑space使用:Mergesort is not optimal
  1. Memory(size N):

    • extra memory: proportional to N
    • 但一个in-place的sorting algorithm 应该只能使用 \leq clgN 的extra memory,如insertion sort,selection sort,shellsort
  2. Stability:

    • sort(): stable
    • merge(): stable
  3. Java Implementation

    public class Merge{
     private static void merge(Comparable[] a, Comparable[] aux, int lo, int mid, int hi){
         
         // assert expression(逻辑运算表达式)
         // 如果expression为true,表示断言成功,程序继续执行。如果为false,会抛出AssertionError
         assert isSorted(a, lo, mid);   // precondition: a[lo..mid] sorted
         assert isSorted(a, mid+1, hi); // precondition: a[mid+1..hi] sorted
    
         // copy
         for(int k = lo; k <= hi; k++){
             aux[k] = a[k];
         }
    
         // merge
         int i = lo;
         int j = mid+1;
         for(int k = lo; k <= hi; k++){
             if(i>mid){
                 // i超出mid,表明i所在的subarray已全部排完
                 // 只需把j所在的subarray的剩余部分copy回a[]即可
                 a[k] = aux[j++]; // 等同于两行代码:a[k] = aux[j]; j++;
             }else if(j>hi){
                 // j超出hi,与上述同理
                 a[k] = aux[i++];
             }else if(less(aux[j],aux[i])){
                 // aux[j]<aux[i], 将aux[j]复制回a[]
                 a[k] = aux[j++];
             }else{
                 // aux[j]>=aux[i], 将aux[i]复制回a[]
                 a[k] = aux[i++];
             }
         }
    
         assert isSorted(a, lo, hi); // postcondition: a[lo..hi] sorted
     }
    
     private static void sort(Comparable[] a, Comparable[] aux, int lo, int hi){
         // 递归终止条件
         if(hi<=lo){
             return;
         }
        
        // 优化1:对于比较小的array(定cutoff=7),用merge sort太浪费memory,改用insertion sort
         int cutoff = 7;
         if(hi <= lo+cutoff - 1){
             Insertion.sort(a, lo, hi); // Insertion.java与Merge.java放在同一个目录下
             return;
         }
        // 结束优化1
        
         int mid = lo + (hi - lo) / 2; // 类似binary research
         sort(a, aux, lo, mid);
         sort(a, aux, mid+1, hi);
        
        // 优化2:如果上一半中最大的item也小于下一半中最小的item,那么merge就不必要了
         if(!less(a[mid+1], a[mid])){
             return;
         }
         // 结束优化2
        
         merge(a, aux, lo, mid, hi);
     }
    
     public static void sort(Comparable[] a){
         aux = new Comparable[a.length];
         sort(a, aux, 0, a.length-1);
     }
    
     private static boolean less(Comparable v, Comparable w){
         return v.CompareTo(w) < 0;
     }
    
     private static void exch(Comparable[] a, int i, int j){
         Comparable swap = a[i];
         a[i] = a[j];
         a[j] = swap;
     }
    
     private static boolean isSorted(Comparable[] a){
         for(int i=1; i<a.length; i++){
             if(less(a[i], a[i-1])){
                 return false;
             }
         }
         return true;
     }
    }
    

    优化3:将merge()函数中:循环里头的aux[]和a[]互换位置,第一个sort()函数中:sort(), merge()里的aux,a互换位置。这样可以save time(but not space)

2. Merge sort(non-recursive、buttom-up)

  1. 思路:

    • 遍历整个array,将size=1的subarray合并起来
    • 再重头开始,不断重复size=2,4,8,16...
  2. Java implementation

    public class MergeBU{
     private static void merge(Comparable[] a, Comparable[] aux, int lo, int mid, int hi){
         
         // assert expression(逻辑运算表达式)
         // 如果expression为true,表示断言成功,程序继续执行。如果为false,会抛出AssertionError
         assert isSorted(a, lo, mid);   // precondition: a[lo..mid] sorted
         assert isSorted(a, mid+1, hi); // precondition: a[mid+1..hi] sorted
    
         // copy
         for(int k = lo; k <= hi; k++){
             aux[k] = a[k];
         }
    
         // merge
         int i = lo;
         int j = mid+1;
         for(int k = lo; k <= hi; k++){
             if(i>mid){
                 // i超出mid,表明i所在的subarray已全部排完
                 // 只需把j所在的subarray的剩余部分copy回a[]即可
                 a[k] = aux[j++]; // 等同于两行代码:a[k] = aux[j]; j++;
             }else if(j>hi){
                 // j超出hi,与上述同理
                 a[k] = aux[i++];
             }else if(less(aux[j],aux[i])){
                 // aux[j]<aux[i], 将aux[j]复制回a[]
                 a[k] = aux[j++];
             }else{
                 // aux[j]>=aux[i], 将aux[i]复制回a[]
                 a[k] = aux[i++];
             }
         }
    
         assert isSorted(a, lo, hi); // postcondition: a[lo..hi] sorted
     }
    
    
     public static void sort(Comparable[] a){
         int n = a.length;
         Comparable[] aux = new Comparable[n];
         for(int sz=1; sz<n; sz = sz+sz){
             for(int lo=0; lo<n-sz; lo+=sz+sz){
                 merge(a, aux, lo+sz-1, Math.min(lo+sz+sz-1, n-1));
             }
         }
     }
    
     private static boolean less(Comparable v, Comparable w){
         return v.CompareTo(w) < 0;
     }
    
     private static void exch(Comparable[] a, int i, int j){
         Comparable swap = a[i];
         a[i] = a[j];
         a[j] = swap;
     }
    
     private static boolean isSorted(Comparable[] a){
         for(int i=1; i<a.length; i++){
             if(less(a[i], a[i-1])){
                 return false;
             }
         }
         return true;
     }
    }
    

3. Comparator interface

  1. 优点

    • 相比较于comparable,comparator对于给定的data type支持多种方式的ordering
  2. 用法:

    • 创建一个Comparator对象

    • 传给Arrays.sort的第二个argument一个自定义的order

      String[] a;
      ...
      // 使用natural order
      Arrays.sort(a); 
      // 使用用Comparator<String>对象中自定义的order
      Arrays.sort(a, String.CASE_INSENSITIVE_ORDER);
      Arrays.sort(a, new BritishPhoneBookOrder());
      
  1. 应用(举例:insertion sort)

    public class Insertion implements Comparator{
     public static void sort(Object[] a, Comparator comparator){
         int n = a.length;
         // 向右移动pointer
         for(int i = 0; i < n; i++){
             // j从右向左移动,a[j]和它左边较大的那个交换位置
             for (int j = i; j > 0; j--){
                 if (less(comparator, a[j], a[j-1])){
                     exch(a, j, j-1)
                 }else{
                     break;
                 }
             }
         }
     }
    
     // item v,w比较大小
     private static boolean less(Comparator c, Object v, Object w){
         return c.compare(v,w) < 0;
     }
    
      // a[i]和a[j]交换位置
     private static void exch(Object[] a, int i, int j){
         Object swap = a[i];
         a[i] = a[j];
         a[j] = swap;
     }
      
      // 检验array是否完成排序
     private static boolean isSorted(Object[] a, Comparator comparator){
         for(int i = 1; i < a.length; i++){
             if(less(comparator, a[i], a[i-1])){
                 return false;
             }
         }
         return true;
     }
    }
    
  1. Comparator interface:implementing

    • 思路:建一个nested class,该类继承接口Comparator,然后在该类中写一个compare()的方法
    public class Student{
      public static final Comparator<Student> BY_NAME = new ByName();
      public static final Comparator<Student> BY_SECTION = new BySection();
      private final String name;
      private final int section;
      ...
      
      //这里的static和上面attribute中的static表明对这个类只有这一个comparator
      private static class ByName implements Comparator<Student>{
        public int compare(Student v, Student w){
          return v.name.compareTo(w.name);
        }
      }
      
      private static class BySection implements Comparator<Student>{
        public int compare(Student v, Student w){
          return v.section - w.section; //这里不会产生overflow的危险
        }
      }
    }
    

4. Stability

  1. 重要性:在排序时,先根据A-order排完了这组data,在此基础上,当我再根据B-order排序时,如果这个sort algorithms是not stable,我的A-order可能会因为第二次排序而打乱;但如果这个sort algorithms是stable的,当我第二次排序结束后,相同的item(基于B-order)之间还保持着原来的A-order
  2. Stable:insertion sort,mergesort
    • Equal item never move past each other
  3. Not stable:selection sort,shell
    • a Long-distance exchange might move an item past some equal item
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容