Median of Two Sorted Arrays
描述
There are two sorted arrays A
and B
of size m
and n
respectively. Find the median of the two sorted arrays. The overall run time complexity should be O(log (m+n))
.
分析
这是一道非常经典的题。这题更通用的形式是,给定两个已经排序好的数组,找到两者所有元素中第k
大的元素。
O(m+n)
的解法比较直观,直接merge两个数组,然后求第k
大的元素。
不过我们仅仅需要第k
大的元素,是不需要“排序”这么昂贵的操作的。可以用一个计数器,记录当前已经找到第m
大的元素了。同时我们使用两个指针pA
和pB
,分别指向A和B数组的第一个元素,使用类似于merge sort的原理,如果数组A当前元素小,那么pA++
,同时m++
;如果数组B当前元素小,那么pB++
,同时m++
。最终当m
等于k
的时候,就得到了我们的答案,O(k)
时间,O(1)
空间。但是,当k
很接近m+n
的时候,这个方法还是O(m+n)
的。
有没有更好的方案呢?我们可以考虑从k
入手。如果我们每次都能够删除一个一定在第k
大元素之前的元素,那么我们需要进行k
次。但是如果每次我们都删除一半呢?由于A和B都是有序的,我们应该充分利用这里面的信息,类似于二分查找,也是充分利用了“有序”。
假设A和B的元素个数都大于k/2
,我们将A的第k/2
个元素(即A[k/2-1]
)和B的第k/2
个元素(即B[k/2-1]
)进行比较,有以下三种情况(为了简化这里先假设k
为偶数,所得到的结论对于k
是奇数也是成立的):
A[k/2-1] == B[k/2-1]
A[k/2-1] > B[k/2-1]
A[k/2-1] < B[k/2-1]
如果A[k/2-1] < B[k/2-1]
,意味着A[0]
到A[k/2-1]
的肯定在的top k元素的范围内,换句话说,A[k/2-1]
不可能大于的第k
大元素。留给读者证明。
因此,我们可以放心的删除A数组的这k/2
个元素。同理,当A[k/2-1] > B[k/2-1]
时,可以删除B数组的k/2
个元素。
当A[k/2-1] == B[k/2-1]
时,说明找到了第k
大的元素,直接返回A[k/2-1]
或B[k/2-1]
即可。
因此,我们可以写一个递归函数。那么函数什么时候应该终止呢?
- 当A或B是空时,直接返回
B[k-1]
或A[k-1]
; - 当
k=1
是,返回min(A[0], B[0])
; - 当
A[k/2-1] == B[k/2-1]
时,返回A[k/2-1]
或B[k/2-1]
代码
// Median of Two Sorted Arrays
// Time Complexity: O(log(m+n)),Space Complexity: O(log(m+n))
public class Solution {
public double findMedianSortedArrays(final int[] A, final int[] B) {
int total = A.length + B.length;
if (total %2 == 1)
return findKth(A, 0, B, 0, total / 2 + 1);
else
return (findKth(A, 0, B, 0, total / 2)
+ findKth(A, 0, B, 0, total / 2 + 1)) / 2.0;
}
private static int findKth(final int[] A, int ai, final int[] B, int bi, int k) {
//always assume that A is shorter than B
if (A.length - ai > B.length - bi) {
return findKth(B, bi, A, ai, k);
}
if (A.length - ai == 0) return B[bi + k - 1];
if (k == 1) return Math.min(A[ai], B[bi]);
//divide k into two parts
int k1 = Math.min(k / 2, A.length - ai), k2 = k - k1;
if (A[ai + k1 - 1] < B[bi + k2 - 1])
return findKth(A, ai + k1, B, bi, k - k1);
else if (A[ai + k1 - 1] > B[bi + k2 - 1])
return findKth(A, ai, B, bi + k2, k - k2);
else
return A[ai + k1 - 1];
}
};