题目
There are two sorted arrays nums1 and nums2 of size m and n respectively.
Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n)).
Example 1:
nums1 = [1, 3]
nums2 = [2]
The median is 2.0
Example 2:
nums1 = [1, 2]
nums2 = [3, 4]
The median is (2 + 3)/2 = 2.5
思路
将两个有序数列合成一个有序数列的话需要O(n+m)的时间,所以考虑不合成的方法。
很自然思考两个数列的中位数与最终的中位数之间的关系。
假设数列{a_n}共有na个数且中位数为A,数列{b_n}共有nb个数且中位数为B。
那么不考虑整除的情况下,A的左右各有(na-1)/2个数,B的左右各有(nb-1)/2个数。通过比较A和B的大小,可以确定A和B之间的两组数字。一开始觉得这样就将问题问题转化为一个规模为原来一半的子问题,并且时间复杂度可以满足题意。
但是后来发现不对,因为无法保证新得到的子问题位于原问题的正中央。所以需要增加约束,希望每次取左右两边的值的时候可以尽量使子问题往中间靠。但是这样一来时间复杂度又变为O(log(n)+log(m)),即O(log(nm)),不满足题意。
在经历了漫长的挣扎之后还是决定看题解……
题解也是取两个数组中的某些数字进行比较,但是没有选择中间的数,而是选择了第k/2个数,这样来描述问题自由度更高。通过比较两个数组中的第k/2个数的大小来逐步缩小范围,从而得到整体的第k个数,最终得到中位数。
实现
class Solution {
public:
double findMedianSortedArrays(vector<int>& nums1, vector<int>& nums2) {
int m=nums1.size();
int n=nums2.size();
vector<int>::iterator A=nums1.begin();
vector<int>::iterator B=nums2.begin();
int k=m+n;
if(k&0x01)
return findKth(A, m, B, n, k/2+1);
else
return (findKth(A, m, B, n, k/2)+findKth(A, m, B, n, k/2+1))/2.0;
}
private:
static double findKth(const vector<int>::iterator & A, int m,
const vector<int>::iterator & B, int n, int k){
if(m>n) return findKth(B, n, A, m, k);
if(m==0)return B[k-1];
if(k==1) return min(A[0], B[0]);
int ia=min(m, k/2), ib=k-ia;
if(A[ia-1]<B[ib-1])
return findKth(A+ia, m-ia, B, n, k-ia);
else if(A[ia-1]>B[ib-1])
return findKth(A, m, B+ib, n-ib, k-ib);
else
return A[ia-1];
}
};
没有太多好说的,基本上就是默写题解。。。
思考
本段代码中几处地方比较巧妙:
- 假定m<n的处理
- 对于m<k/2的处理