求第k小系列(二):在两个排序好的数组中找第k小


第k小 二分法 c++

题目描述:

There are two sorted arrays nums1 and nums2 of size m and n respectively.

Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).

You may assume nums1 and nums2 cannot be both empty.

e.g.

nums1 = [1, 2]
nums2 = [3, 4]

The median is (2 + 3)/2 = 2.5

解题分析:

假设待合并的两个数组为 A (size: m) 和 B (size:n),既然要求的时间复杂度是lg,一般是将数组分成两部分,即二分法,可以满足这种时间复杂度。

1.这个中位数应当再哪里?

将数组A分为 [0, i-1] 和 [i, m-1] 两部分(0 <= i <= m),数据B分为 [0, j-1] 和 [j, n-1] 两部分(0 <= j <= n)。

将 left_A 和 left_B放入一个集合,并将 right_A 和 right_B 放入另一个集合。 再把这两个新的集合分别命名为
left_part 和 right_part:

      left_part          |        right_part
A[0], A[1], ..., A[i-1]  |  A[i], A[i+1], ..., A[m-1]
B[0], B[1], ..., B[j-1]  |  B[j], B[j+1], ..., B[n-1]

A有m+1种分法,B有n+1种分法

在满足如下条件情况下(边界情况暂不考虑):

max(left_part)≤min⁡(right_part) => A[ i-1 ] ≤ B[ j ] && B[ j-1 ] ≤ A[ I ]

  • m+n 为偶数:len(left_part)=len(right_part) => i+j = m-i+n-j => i+j = (m+n+1)/2

所求中位数为:median = (max(left_part)+min⁡(right_part))/2

  • m+n 为奇数:len(left_part)=len(right_part)+1 => i+j = m-i+n-j+1 => i+j = (m+n+1)/2

所求中位数为:median = max(left_part)

if ((size1 + size2) % 2 == 0) return (left + right) * 1.0 / 2;
else return left;
2.应当满足什么条件

进一步分析条件:

① 0 ≤ j ≤ n;② j = (m+n+1)/2-i ;③ 0 ≤ i≤ m

②③ => ④ : n≥m(不过i取任何值,j 都不为负数)

①② => : 0 ≤ (m+n+1)/2-i ≤ n ,(m-n+1)/2 ≤ i;此条件在④条件下无意义

所以我们需要找到 i 满足

A[ i-1 ] ≤ B[ j ] && B[ j-1 ] ≤ A[ i ] ,且 j = (m+n+1)/2-i ,n≥m

    // 1 对应的是长度较短的数组A
    // 2 对应的是长度较长的数组B
    int min1 = 0, max1 = 0;  // 长度较短的数组的最大最小值
    int size1, size2; // 记录下大小
    if (nums1.size() > nums2.size()) {
        // 如果1比2大,则交换数组
        vector<int> temp;
        temp.assign(nums2.begin(), nums2.end());
        nums2.assign(nums1.begin(), nums1.end());
        nums1.assign(temp.begin(), temp.end());
    }
    size1 = nums1.size();
    size2 = nums2.size();

    // max1不用size-1,因为插空分,是可以分到末尾的
    max1 = nums1.size();

    // 记录下两个数组二分的中间值
    int p1;
    int p2;
    // 根据二分获得中位数左边值,中位数右边值
    // 最后根据size1+size2的奇偶性判断median取值
    int left, right;
    while (min1 <= max1) {
        p1 = (min1 + max1) / 2;
        p2 = (size1 + size2 + 1) / 2 - p1;
        ...
    }

3.如何二分搜索找到 i
  1. 设imin=0,imax=m,然后开始在[imin,imax]中进行搜索。

  2. i = (imin+imax)/2, j = (m+n+1)/2-i

  3. 遇到如下几种情况:

    • A[ i-1 ] ≤ B[ j ] && B[ j-1 ] ≤ A[ I ]

      满足条件,直接根据m+n的奇偶性返回值

    • A[ i-1 ] > B[ j ]

      说明 A[ i-1 ] 太大了,需要将 i 减小,则搜索范围调整为[ imin, i−1 ],更新 imax 和 i

    • B[ j-1 ] > A[ I ]

      说明A[ i ] 太小了,需要将 i 增大,则搜索范围调整为[ i+1, imax ],更新 imin 和 i

        // 应当先调大小,可能存在临界值不满足大小关系
        if (p1 > 0 && nums1[p1 - 1] > nums2[p2]) {
            // 说明较短数组的中间值过大,应当调小
            max1 = p1 - 1;
        } else if (p1 < size1 && nums2[p2 - 1] > nums1[p1]) {
            // 说明较短数组的中间值过小,应当调大
            min1 = p1 + 1;
        } else {
            // 前两个情况均为临界值,先检查异常情况
            if (临界值) { 
                .......
            } else {
                // 在边界内
                left = max(nums1[p1 - 1], nums2[p2 - 1]);
                right = min(nums1[p1], nums2[p2]);
                break;
            }

4. 临界值分析

当 i=0,i=m , j=0 , j=n 时会存在 i-1, i+1 越界的情况。

我们先分析i和j是否会取到临界值:

  1. i=0时,A数组全部被分到右边, 可能存在j=n的临界值情况,
    需保证:B[j-1] ≤ A[I],
i=0
  1. i=m时,A数据全部被分到左边,可能存在j=0的临界值情况,
    需保证:A[i-1] ≤ B[j]
i=m
  1. 根据下面的推论可知,当i不为上面的值时,j不可能取到边界值:
0<i<m
       else {
            // 前两个情况均为临界值,先检查异常情况
            if (p1 == 0) { // 长度较短的数组A达到最小值
                // 即数组A全部被分到右边
                left = nums2[p2 - 1];
                // 存在数组B取到边界值的情况
                if (p2 == size2) right = nums1[p1];
                else right = min(nums1[p1], nums2[p2]);
                break;
            } else if (p1 == size1) { // 长度较短的数组A达到最大值
                // 即数组A全部被分到左边
                right = nums2[p2];
                if (p2 == 0) left = nums1[p1 - 1];
                else left = max(nums1[p1 - 1], nums2[p2 - 1]);
                break;
            } else {
                // 在边界内
                left = max(nums1[p1 - 1], nums2[p2 - 1]);
                right = min(nums1[p1], nums2[p2]);
                break;
            }
        }

ps 具体代码参加GitHub地址:
https://github.com/chenshuyuhhh/acm/blob/master/binary/findMedianSortedArrays.cpp

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343