算法分析与设计(一)——寻找两个有序数组的中位数

一、问题描述

给定两个大小为 m 和 n 的有序数组 nums1 和 nums2。
请你找出这两个有序数组的中位数,并且要求算法的时间复杂度为 O(log(m + n))。
你可以假设 nums1 和 nums2 不会同时为空。

示例 1:

nums1 = [1, 3]
nums2 = [2]
则中位数是 2.0

示例 2:

nums1 = [1, 2]
nums2 = [3, 4]
则中位数是 (2 + 3)/2 = 2.5

二、设计过程

方法:递归法

为了解决这个问题,需要理解“中位数的作用是什么”。在统计中,中位数被用来:
将一个集合划分为两个长度相等的子集,其中一个子集中的元素总是大于另一个子集中的元素。
如果理解了中位数的划分作用,就很接近答案了。
首先,让在任一位置i将A划分成两个部分:
left_A | right_A
A[0], A[1], ..., A[i-1] | A[i], A[i+1], ..., A[m-1]

由于 A 中有 m 个元素, 所以有 m+1 种划分的方法(i =0∼m)。
知道;
len(left_A)=i,len(right_A)=m−i.
注意:当 i=0 时left_A 为空集,而当 i=m 时, right_A为空集。
采用同样的方式,在任一位置j将B划分成两个部分:
left_B | right_B
B[0], B[1], ..., B[j-1] | B[j], B[j+1], ..., B[n-1]
将 left_A 和 left_B 放入一个集合,并将 right_A 和 right_B 放入另一个集合。 再把这两个新的集合分别命名为 left_part 和right_part:
left_part | right_part
A[0], A[1], ..., A[i-1] | A[i], A[i+1], ..., A[m-1]
B[0], B[1], ..., B[j-1] | B[j], B[j+1], ..., B[n-1]
如果可以确认:
1.len{left_part}=len(right_part)
2.max(left_part)≤min(right_part)
那么,已经将{A,B}中的所有元素划分为相同长度的两个部分,且其中一部分中的元素总是大于另一部分中的元素。那么:
median=max(left_part)/2+min(right_part)/2
要确保这两个条件,只需要保证:
1.i+j=m−i+n−j(或:m - i + n - j + 1) 如果n≥m,只需要使i=0∼m,j=(m+n+1)/2−i

  1. B[j−1]≤A[i] 以及 A[i−1]≤B[j]
    ps.1 为了简化分析,我假设A[i−1],B[j−1],A[i],B[j] 总是存在,哪怕出现 i=0, i=m, j=0,或是 j=n 这样的临界条件。 我将在最后讨论如何处理这些临界值。
    ps.2 为什么n≥m?由于0≤i≤m 且j=(m+n+1)/2−i,必须确保j不是负数。如果 n<m,那么 j 将可能是负数,而这会造成错误的答案。
    所以,需要做的是:
    在 [0,m] 中搜索并找到目标对象 i,以使:
    B[j−1]≤A[i] 且A[i−1]≤B[j], 其中j=(m+n+1)/2−i
    接着,可以按照以下步骤来进行二叉树搜索:
    1.设imin=0,imax=m, 然后开始在[imin,imax] 中进行搜索。
    2.令i=(imin+imax)/2,j=(m+n+1)/2−i
    3.现在有 len(left_part)=len(right_part)。 而且只会遇到三种情况:.
    B[j−1]≤A[i] 且 A[i−1]≤B[j]:
    这意味着找到了目标对象 ii,所以可以停止搜索。
    B[j−1]>A[i]:
    这意味着A[i]太小,必须调整i以使B[j−1]≤A[i]。
    可以增大 ii 吗?
    是的,因为当i被增大的时候,j就会被减小。
    因此B[j−1]会减小,而A[i]会增大,那么B[j−1]≤A[i]就可能被满足。
    可以减小i吗?
    不行,因为当i被减小的时候,j就会被增大。
    因此B[j−1]会增大,而A[i]会减小,那么B[j−1]≤A[i] 就可能不满足。
    所以必须增大i。也就是说,必须将搜索范围调整为[i+1,imax]。 因此,设imin=i+1,并转到步骤 2。
    A[i−1]>B[j]:这意味着A[i−1] 太大,必须减小i以使A[i−1]≤B[j]。 也就是说,必须将搜索范围调整为 [imin,i−1]。
    因此,设imax=i−1,并转到步骤 2。
    当找到目标对象 i 时,中位数为:
    max(A[i−1],B[j−1]),当m+n为奇数时
    {max(A[i−1],B[j−1])+min(A[i],B[j])}/2, 当m+n为偶数时
    现在,让来考虑这些临界值 i=0,i=m,j=0,j=n,j=n,此时A[i−1],B[j−1],A[i],B[j] 可能不存在。 其实这种情况比你想象的要容易得多。
    需要做的是确保max(left_part)≤min(right_part)。 因此,如果i和j不是临界值(这意味着 A[i−1],B[j−1],A[i],B[j] 全部存在), 那么必须同时检查 B[j−1]≤A[i]以及A[i−1]≤B[j]是否成立。 但是如果 A[i−1],B[j−1],A[i],B[j] 中部分不存在,那么只需要检查这两个条件中的一个(或不需要检查)。 举个例子,如果i=0,那么A[i−1]不存在,就不需要检查A[i−1]≤B[j] 是否成立。所以,需要做的是:
    在 [0,m] 中搜索并找到目标对象i,以使:
    (j=0 or i=m or B[j−1]≤A[i]) 或是 (i = 0(i=0 or j = nj=n or A[i−1]≤B[j]), 其中j=(m+n+1)/2−i
    在循环搜索中,只会遇到三种情况:
  2. (j=0 or i=m or B[j−1]≤A[i]) 或是(i=0 or j=n or A[i−1]≤B[j]),这意味着i是完美的,可以停止搜索。
  3. j>0 and i<m and B[j−1]>A[i] 这意味着 I 太小,必须增大它。
  4. i>0 and j<n and A[i−1]>B[j] 这意味着 i 太大,必须减小它。
    i<m⟹j>0以及i>0⟹j<n 始终成立,这是因为:
    i<m⟹j=(m+n+1)/2−i>(m+n+1)/2−m≥(2m+1−m)/2≥0
    i>0⟹j=(m+n+1)/2−i<(m+n+1)/2≤(2n+1)/2≤n
    所以,在情况 2 和 3中,不需要检查j>0或是j<n是否成立。

三、程序代码

lass Solution {
    public double findMedianSortedArrays(int[] A, int[] B) {
        int m = A.length;
        int n = B.length;
        if (m > n) { // to ensure m<=n
            int[] temp = A; A = B; B = temp;
            int tmp = m; m = n; n = tmp;
        }
        int iMin = 0, iMax = m, halfLen = (m + n + 1) / 2;
        while (iMin <= iMax) {
            int i = (iMin + iMax) / 2;
            int j = halfLen - i;
            if (i < iMax && B[j-1] > A[i]){
                iMin = i + 1; // i is too small
            }
            else if (i > iMin && A[i-1] > B[j]) {
                iMax = i - 1; // i is too big
            }
            else { // i is perfect
                int maxLeft = 0;
                if (i == 0) { maxLeft = B[j-1]; }
                else if (j == 0) { maxLeft = A[i-1]; }
                else { maxLeft = Math.max(A[i-1], B[j-1]); }
                if ( (m + n) % 2 == 1 ) { return maxLeft; }

                int minRight = 0;
                if (i == m) { minRight = B[j]; }
                else if (j == n) { minRight = A[i]; }
                else { minRight = Math.min(B[j], A[i]); }

                return (maxLeft + minRight) / 2.0;
            }
        }
        return 0.0;
    }
}

四、复杂度分析

• 时间复杂度O(log(min(m,n))),
首先,查找的区间是 [0,m]。 而该区间的长度在每次循环之后都会减少为原来的一半。 所以,只需要执行 log(m) 次循环。由于在每次循环中进行常量次数的操作,所以时间复杂度为O(log(m))。 由于m≤n,所以时间复杂度是 O(log(min(m,n)))。
• 空间复杂度: O(1), 只需要恒定的内存来存储 99 个局部变量, 所以空间复杂度为O(1)。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容