二分查找

int binary_search(int* a, int len, int goal){
    int low = 0;
    int high = len -1;
    while (low <= high) {
        int middle = (high - low) / 2 + low; // 直接使用(high + low) / 2 可能导致溢出
        if (a[middle] == goal)
            return middle;
        //在左半边
        if (a[middle] > goal)
            high = middle - 1;
        //在右半边
        else
            low = middle + 1;
    }
    //没找到
    return -1;
}

原理并不复杂,[low,high]构成了潜在区间,如果中值不等于目标,则减半对应的区间。
有一个问题:为什么循环条件是小于等于,而不是小于?
因为假设在[1,3]中寻找2,low和high会重合,但是还不确定能否找到目标值,循环不应该停止。

最后的情形

因为整数求一般是向下取整,所以最后剩下两三个数的时候,会有一些情况:
最后剩下两三个数的情况

最后剩下两个数
最后剩下三个数

思考

对于二分搜索来说,如果找不到,每次都会移动左边界或右边界,每次边界至少会移动1个位置,且两个边界每次只有一个移动,而且移动时不会超过另一侧的边界,那么两边界最终一定会相遇。每次移动时,目标都处于两边界之间(含),所以最后两边界重合时,目标只可能是两边界重合的位置或不存在。所以即使两边界重合,还要做一次判断才可以。所以循环条件加入了等于的情况,其实如果不加等于,后续做一次判断,也是完全可以的。

有重复值的二分查找

对于一个有序数组arr,再给定一个整数num,请在arr中找到num这个数出现的最左边的位置。

给定一个数组arr及它的大小n,同时给定num。请返回所求位置。若该元素在数组中未出现,请返回-1。

    int findPos(vector<int> arr, int n, int num) {
        if(n==0)
            return -1;
        int left=0,right=n-1;
        while(left<right){
            int mid=left+(right-left)/2;
            if(arr[mid]<num){
                left=mid+1;
            }else if(arr[mid]>num){
                right=mid-1;
            }else{
                right=mid;
            }
        }
        if(arr[left]==num)
            return left;
        else
            return -1;
    }

两者最大的区别在于,如果mid指示的值等于目标值,那么还不能确定目标值的最左位置,但mid位置依然在我们的左右边界内。此时右边界赋值为mid,而不是mid-1。因为不能排除mid出待定区间。
这样也会有问题,那就是每次循环不保证一定会缩减边界区间,会出现死循环。死循环发生在mid==right的情况,即left==right的时候。所以循环条件不能包括等于,而且需要在循环结束后再做一次判断。

思考

对于二分查找来说,我们界定一个区间,这个区间表示了目标潜在的可能位置。每次迭代时缩减此区间,则最终当此区间只有一个位置时,目标要么不存在,要么一定在该位置。

局部最小值

arr中数据呈波谷状排列,已知arr中任意两个相邻的数都不相等,写一个函数返回arr中波谷位置。
思路:对于中间值mid,需要判断mid和左右邻居的大小关系。如果是波谷,那么其左右邻居一定都大于mid。同理,可以判断是否是递减区或递增区,再做进一步调整。
注意:如果波谷点在首尾的位置的话,立即返回首尾位置。

    int getLessIndex(vector<int> arr) {
        int len = arr.size();
        if (len == 0) return -1;
        if (len == 1) return 0;
        if (arr[0] < arr[1]) return 0;
        if (arr[len-1] < arr[len-2]) return len-1;
        int left=0,right=len-1;
        while (left <= right) {
            int mid = left+(right-left)/2;
            if (arr[mid+1] > arr[mid] && arr[mid-1] > arr[mid]) {
                return mid;
            }else if (arr[mid] > arr[mid-1]) {
                right = mid;
            }else if (arr[mid] > arr[mid+1]) {
                left = mid;
            }
        }
        return -1;
    }

循环有序数组

对于一个有序循环数组arr,返回arr中的最小值。有序循环数组是指,有序数组左边任意长度的部分放到右边去,右边的部分拿到左边来。比如数组[1,2,3,3,4],是有序循环数组,[4,1,2,3,3]也是。

    int getMin(vector<int> arr, int n) {
        if(n<=1)
            return arr[0];
        int left=0,right=n-1;
        while(left<right){
            if(arr[left]<arr[right])
                return arr[left];
            int mid=left+(right-left)/2;
            if(arr[mid]>arr[left]){
                left=mid+1;
            }else if(arr[mid]<arr[left]){
                right=mid;
            }else{
                if(arr[left]>arr[right])
                    left=mid+1;
                else{
                    int i;
                    for(i=left;i<mid;++i){
                        if(arr[i]!=arr[left])
                            break;
                    }
                    if(i==mid)
                        left=mid+1;
                    else
                        right=mid-1;
                }
                
            }
               
        }
        return arr[left];
    }

说明:
假设本来的序列是[arr1,arr2],移动后是[arr2,arr1].以为原始序列单调不减,所以arr1中元素小于等于arr2中元素。left是arr2的首,right是arr1的尾,所以arr[left]应该大于等于arr[right]。否则该串并未发生交换,或者left已经找到了最小值点,应立即返回left。
对于[1,2,3,3,4],交换后[3,4,1,2,3];对于交换后的序列,如果mid值大于等于left值,则应处于arr1队列;如果小于,则一定处于arr2队列。但这其中有一个问题,如果left和right和mid值都相等,那么就无法判断了。比如[1 2 2 2 2 2]->[2 1 2 2 2 2]->[2 2 2 2 1 2]首尾以及mid都是2,但是1可能在arr1和arr2是不确定的。这种情况arr1和arr2中一定有一个全部元素相等的序列,只需对其中一个序列进行遍历来判断即可。
所以策略如下:

  • 如果left值小于right,则返回left。此时表示最小值已找到。
  • 如果mid值大于left,则mid应处于arr2序列。缩减左边界至mid后一位
  • 如果mid值大于right,则mid应处于arr1序列。缩减右边界至mid前一位
  • 如果mid值等于left,判断left和right值是否相等。
    • 若否,则mid应处于arr2序列,缩减左边界至mid后一位
    • 若是,则需遍历[left,mid],判断其是否是全等序列,再调整区间边界。

关于终止条件

如果[4 1 2]的情况,判定mid属于arr1序列,会缩减左边界,此时是[1 2],这时候会触发终止条件。所以在决定终止条件的时候,需要想清楚最终可能的情况。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1 前言 二分查找本身是个简单的算法,但是正是因为其简单,更容易写错。甚至于在二分查找算法刚出现的时候,也是存在b...
    __七把刀__阅读 1,418评论 0 1
  • 二分查找 二分查找算法是一种在有序数组中查找某一特定元素的搜索算法。搜素过程从数组的中间元素开始,如果中间元素正好...
    JasonDing阅读 1,547评论 0 3
  • 大纲:很早之前就知道冒泡、选择、插入,二分查找法却没有详细的研究过他们之间的区别,今天就静下来,将它们好好总结一下...
    彗星来的那一夜阅读 1,377评论 0 5
  • 今天去参加面试的时候被提问到一个问题--请你解释一下二分查找。一时间忽然想不起来。于是乎回来复习了一下。 在百度百...
    specter_hhg阅读 4,148评论 9 8
  • 二分查找 简介 二分查找作为高效的查找算法,可以说是每个学计算机的都应该懂的,在每年的面试中,可以说是必须考察的点...
    Lervard阅读 715评论 0 2