Leetcode 刷题指北 4. Median of Two Sorted Arrays


There are two sorted arrays nums1 and nums2 of size m and n respectively.
Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

Example 1:

nums1 = [1, 3]
nums2 = [2]
The median is 2.0

Example 2:

nums1 = [1, 2]
nums2 = [3, 4]
The median is (2 + 3)/2 = 2.5

解题思路

时间复杂度: O(log(min(m + n)))
题眼:
1、两个数组时已排序的
2、解法的时间复杂度在O(log(m+n))以内。(下面的思路优于这个复杂度)
从题意知,在考察二分查找。

中位数
我们的目的是找到这样一个数。能将一个数集划分成等长的两个子集,使得其中一个子集的数全部小于另一个子集。

思路:.

  1. 定义小的子集为left_part,大的子集为right_part。我们要做的是将接收到的两个数组nums1nums2,一部分较小的数分到left_part,剩余较大的数分到right_part。且需要保证两个子集等长(这时不包括中位数本身)。nums1i划分成,nums2j划分,如下:
nums1[0], ..., nums1[i -1] | nums1[i], ..., nums1[m]
nums2[0], ..., nums2[j -1] | nums2[j], ..., nums2[n]

满足以上描述的划分的数学表达:

// 1. 左边个数 = 右边个数
i + j = (m - i) + (n - j); // 中位数不在数组中的情况,即 (m + n) % 2 = 0 时。
i + j = (m - i) + (n - j) + 1; // 中位数本身存在两个数组中,即 (m + n) % 2 != 0 时。
                                // 我们约定把中位数划分到 left_part 。

// 2. left_part 全部小于或等于 right_part , 因为 nums1 和 nums2 全部已排序,不需要与自身元素再比较大小。
nums2[j - 1] < nums1[i] && nums1[i - 1] < nums2[j] 
  1. 做好了这样一个划分以后,中位数就很好找了。偶数情况,中位数是left_part中的最大与right_part中的最小的均值。奇数情况,中位数是left_part中的最大(因为我们约定把它归到left_part
median = (max(nums1[i - 1], nums2[j - 1]) + max(nums1[i] + nums2[j])) / 2; // (m + n) % 2 = 0
median = max(nums1[i - 1], nums2[j - 1]) // (m + n) % 2 != 0    
  1. 从1中的等式,我们发现,对于确定的ij也被唯一确定。对于两种情况,分别有:
j = (m + n) / 2 - i;
j = (m + n + 1) / 2 - i; // (m + n) % 2 != 0 

其实,只需要使用第二个式子表达,因为在偶数情况时,1/2不会起作用,小数部分在代码中会被强取整约掉。

  1. 所以,本题就转变成了在区间[0, m]中查找一个合适的i的二分查找问题。算法描述如下:
1. 在区间 [left, right](初始时,left = 0,right = m) 二分查找一个 i = nums[mid] ,
相应的 j = (m + n + 1) / 2 - i。

2. 检查 left_part 和 right_part 中数的大小关系:
  a. nums2[j - 1] < nums1[i] && nums1[i - 1] < nums2[j]
    i 符合要求,停止查找,跳到3。
  b. nums2[j - 1] > nums1[i]
    i 小了,将查找范围调整到 [mid, right],返回1执行。
  c. nums1[i - 1] > nums2[j]
    i 大了,将查找范围调整到 [left, mid],返回1执行。
3. 计算返回中位数。参考思路第二部分。
  1. 以上是主要思路与步骤,接下来,还得考虑一些特殊情况。
    a. 边界问题。即可能出现i = 0,j = 0, i = n, j =m的情况,使得nums1[i - 1],nums2[j - 1],nums1[i],nums[j]参生越界。这四种情况分别表示:将nums1nums2全部划分到right_part,将nums1,nums2全部划分到left_part。搞清楚这个意义以后,就很好处理了。
    例如: 当 i = 0 时,nums1已经全部划分到right_part,就不必判断nums1[i - 1] < nums2[j](我们做这个判断的初衷是保证left_part < right_part)。在算中位数的时候,left_part中最大的一定是nums2[j - 1],而不必再考虑nums[i - 1],其他同理。
    b. left_part和right_part边界数字重复问题。即left_part中最大的数与right_part中最小的数相同,这也很好解决,这种情况下中位数就是这个边界重复数,可以一并划分到符合停止条件。
    综上a和b,将4中第2步里的判断条件更改为:
(i == 0 || j == n || nums1[i - 1] <= nums2[j]) && (j == 0 || i == m || nums2[j - 1] <= nums1[i])

解题源码

#include<iostream>
#include<vector>
#include<algorithm>
using namespace std;

class Solution {
public:
    double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
        int m = nums1.size(), n = nums2.size();
        if (m > n) return findMedianSortedArrays(nums2, nums1);
        
        int left = 0, right = m;
        int i = -1, j = -1;

        // 查找合适的i
        while (true)
        {
            i = (left + right) / 2;
            j = (m + n + 1) / 2 - i;
            if ((i == 0 || j == n || nums1[i - 1] <= nums2[j]) &&
                (j == 0 || i == m || nums2[j - 1] <= nums1[i])) {
                break;
            }
            else if (i > 0 && nums1[i - 1] > nums2[j]) {
                right = i - 1;
            }
            else if (j > 0 && nums2[j - 1] > nums1[i]) {
                left = i + 1;
            }
        }

        // 计算中位数
        int max_left = -1, min_right = -1;

        if (i == 0) max_left = nums2[j - 1];// 如果i == 0,left_part中最大的一定是nums2[j - 1],而不必考虑nums1[i - 1]
        else if (j == 0) max_left = nums1[i - 1];   
        else
        {
            max_left = max(nums1[i - 1], nums2[j - 1]);
        }
        if ((m + n) % 2) {
            return max_left;// i,j的取值符合这个约定:奇数情况,中位数划归到left_part
        }

        if (i == m) min_right = nums2[j];
        else if (j == n) min_right = nums1[i];
        else
        {
            min_right = min(nums1[i], nums2[j]);
        }
        
        return double(max_left + min_right) / 2;
    }
};

参考

Discuss

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容