深入浅出二分查找

二分查找是面试常考的知识点,其方法是在有序序列中寻找满足特定条件的值,存在许多不同的变种,最近在刷Leetcode深有感触,整理整理。

说明:

  1. 本文的二分查找变种都来自于Leetcode
  2. 本文不考虑整数溢出问题

普通的二分查找

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 对于arr[mid] < targetarr[left,...,mid]均小于target,那么target只可能存在于arr[mid+1,...,right]
  3. 对于arr[mid] > targetarr[mid,...,right]均大于target,那么target只可能存在于arr[left,...,mid-1]
  4. 对于arr[mid]==target,我们已经找到了,直接返回下标;
  5. 对于2和3,只要满足left<=right,表示总有数可以寻找。
普通二分查找
import unittest

class Solution:
    def search(self, nums, target):
        """
        :type nums: List[int]
        :type target: int
        :rtype: int
        """

        l,h = 0, len(nums) - 1

        while l<=h:
            m = l + (h-l)//2
            if nums[m] == target:
                return m
            elif nums[m] > target:
                h = m - 1
            else:
                l = m + 1

        return -1

class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [-1, 0, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 9), 4)
    
    def test_two(self):
        input = [-1, 0, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 2), -1)

if __name__ == "__main__":
    unittest.main()

寻找target出现的第一个位置(数组可能存在重复数)

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 对于arr[mid] < targetarr[left,...,mid]均小于target,那么target只可能存在于arr[mid+1,...,right]
  3. 对于arr[mid] > targetarr[mid,...,right]均大于target,那么target只可能存在于arr[left,...,mid-1]
  4. 对于arr[mid]==target,我们已经找到了相等的值,此时可能是第一个值,也可能是中间某一个,但arr[mid+1,..,right]是不可能存在的第一个值的。因此应该选择right=mid
  5. 对于2和3,只要满足left<right,表示总有数可以寻找,而left==right时,已经是最后一个数了,此时判断该数是否是target即可。
import unittest

class Solution:
    def search(self, nums, target):
        """
        :type nums: List[int]
        :type target: int
        :rtype: int
        """

        if len(nums) == 0:
            return -1

        l = 0
        h = len(nums) - 1

        while l < h:
            m = l + (h-l)//2
            if nums[m] == target:
                h = m
            elif nums[m] < target:
                l = m + 1
            else:
                h = m - 1

        if nums[l] != target:
            return -1
        
        return l

class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 3), 2)
    
    def test_two(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 2), -1)

if __name__ == "__main__":
    unittest.main()

寻找target最后出现的位置(数组可能存在重复数)

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 对于arr[mid] < targetarr[left,...,mid]均小于target,那么target只可能存在于arr[mid+1,...,right]
  3. 对于arr[mid] > targetarr[mid,...,right]均大于target,那么target只可能存在于arr[left,...,mid-1]
  4. 对于arr[mid]==target,我们已经找到了相等的值,此时可能是最后一个值,也可能是中间某一个,但arr[left,..,mid-1]是不可能存在的第一个值的。因此应该选择left=mid,但这里有个问题,就是当left+1==right的时候,mid总等于left,此时会陷入无限循环,因此需要人工干预一下
  5. 对于2和3,只要满足left<right,表示总有数可以寻找,而left==right时,已经是最后一个数了,此时判断该数是否是target即可。

人工干预的两种方式:

  1. left == midarr[mid]==target的时候,表示此时leftright相邻,而left可能是重复值的中间部分,因此先判断right是否等于target,相等返回right,不相等就返回left。当left == right时由于只剩一个值,只需判断arr[left]是否等于target即可。
  2. 终止条件设置为left < right - 1,这样循环就会在l和h相邻时终止,此时先判断arr[right]是否等于target,不等再判断arr[left]
import unittest

class Solution:
    def search(self, nums, target):
        """
        :type nums: List[int]
        :type target: int
        :rtype: int
        """

        if len(nums) == 0:
            return -1

        l = 0
        h = len(nums) - 1

        while l < h:
            m = l + (h-l)//2
            if nums[m] == target:
                if m == l:
                    if nums[h] == target:
                        return h
                    else:
                        return l
                l = m
            elif nums[m] < target:
                l = m + 1
            else:
                h = m - 1

        if nums[h] != target:
            return -1
        
        return h

    def search2(self, nums, target):
        if len(nums) == 0:
            return -1

        l = 0
        h = len(nums) - 1

        while l < h - 1:
            m = l + (h-l)//2
            if nums[m] == target:
                l = m
            elif nums[m] < target:
                l = m + 1
            else:
                h = m - 1
        
        high = -1 
        if nums[h] == target:
            high = h 
        elif nums[l] == target:
            high = l

        return high

class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 3), 3)
        self.assertEqual(self.s.search2(input, 3), 3)
    
    def test_two(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 2), -1)
        self.assertEqual(self.s.search2(input, 2), -1)

if __name__ == "__main__":
    unittest.main()

返回小于target的最后一个元素x的下标(target可能不存在数组中)

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 对于arr[mid] < targetarr[left,...,mid]均小于target,那么x只可能存在于arr[mid,...,right],令left=mid
  3. 对于arr[mid] > targetarr[mid,...,right]均大于x,那么x只可能存在于arr[left,...,mid-1],令right=mid-1
  4. 对于arr[mid]==targetx只可能存在于arr[left,...,mid-1],令right=mid-1
  5. left+1==right的时候,mid总等于left,此时会陷入无限循环,因此需要人工干预一下,将条件设置为left < right - 1,在外层,先检查right再检查left
import unittest

class Solution:
    def search(self, nums, target):
        if len(nums) == 0:
            return -1

        l = 0
        h = len(nums) - 1

        while l < h - 1:
            m = l + (h-l)//2
            if nums[m] < target:
                l = m 
            elif nums[m] >= target:
                h = m - 1
        
        pos = -1 
        if nums[h] < target:
            pos = h
        elif nums[l] < target:
            pos = l

        return pos

class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 3), 1)
    
    def test_two(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 2), 1)

    def test_three(self):
        input = [0]
        self.assertEqual(self.s.search(input, 0), -1)

if __name__ == "__main__":
    unittest.main()

返回大于target的第一个元素x的下标(target可能不存在数组中)

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 对于arr[mid] < targetarr[left,...,mid]均小于target,那么x只可能存在于arr[mid+1,...,right],令left=mid+1
  3. 对于arr[mid] > targetarr[mid,...,right]均大于x,那么x只可能存在于arr[left,...,mid],令right=mid
  4. 对于arr[mid]==targetx只可能存在于arr[mid+1,...,right],令left=mid+1
  5. 判断arr[left]是否大于target即可
import unittest

class Solution:
    def search(self, nums, target):
        if len(nums) == 0:
            return -1

        l = 0
        h = len(nums) - 1

        while l < h:
            m = l + (h-l)//2
            if nums[m] <= target:
                l = m + 1
            elif nums[m] >= target:
                h = m
        
        pos = -1 
        if nums[l] > target:
            pos = l

        return pos

class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 3), 4)
    
    def test_two(self):
        input = [-1, 0, 3, 3, 5, 9, 12]
        self.assertEqual(self.s.search(input, 2), 2)

    def test_three(self):
        input = [0]
        self.assertEqual(self.s.search(input, 0), -1)

if __name__ == "__main__":
    unittest.main()

在一个旋转数组中寻找指定target的位置(不存在重复元素)

旋转数组有个特点,就是至少有一边是有序的

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 判断arr[left]<=arr[mid]来确定是否左边有序(注意这边一定要等号,因为mid总是靠近left),否则表示另一边有序;
  3. 判断target是否在有序的一方,如果在,则在当前范围内继续查找,否则在另一边查找。
import unittest

class Solution:
  def search(self, nums, target):
    """
    :type nums: List[int]
    :type target: int
    :rtype: int
    """

    if len(nums) == 0:
        return -1

    l,h = 0,len(nums) -1
    
    while l <= h:
        mid = l + (h-l)//2

        if nums[mid] == target:
            return mid

        if nums[mid] >= nums[l]:
            # 左边有序
            if target >= nums[l] and target < nums[mid]:
                h = mid -1
            else:
                l = mid + 1
        else:
            # 右边有序
            if target > nums[mid] and target <= nums[h]:
                l = mid + 1
            else:
                h = mid - 1
    return -1

class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()
    
    def test_one(self):
        input = [4, 5, 6, 7, 0, 1, 2]
        target = 0
        self.assertEqual(self.s.search(input, target), 4)

    def test_two(self):
        input = [4,5,6,7,0,1,2]
        target = 8
        self.assertEqual(self.s.search(input, target), -1)
    def test_three(self):
        input = [3,1]
        target = 1
        self.assertEqual(self.s.search(input, target), 1)

if __name__ == "__main__":
    unittest.main()

旋转数组的最小值

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 判断arr[left]<=arr[mid]来确定是否左边有序(注意这边一定要等号,因为mid总是靠近left),否则表示另一边有序,如果左边和右边皆有序,那么最小值一定是arr[left]
  3. 如果左边有序,则left=mid,如果右边有序,则right=mid终止条件为两个leftright相邻,此时left是前面子数组的最后一个,right是后面子数组的第一个,此时返回right

注意:如果选择旋转数组旋转为0,即本身有序,那么上面方法就会失效,因此在之前判断数组本身是否有序。

import unittest

class Solution:
    def findMin(self, nums):
        """
        :type nums: List[int]
        :rtype: int
        """

        if len(nums) == 0:
            return -1
        #数组本身有序
        if nums[0] <= nums[-1]:
            return nums[0]

        l,h = 0,len(nums) - 1

        while l < h:
            m = l + (h-l)//2

            if nums[l] <= nums[m]:
                #左边有序
                if nums[m] <= nums[h]:
                    # 右边有序
                    return l
                else:
                    l = m+1
            else:
                #右边有序
                h = m
        return l


class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [4,5,6,1,2,3]
        self.assertEqual(self.s.findMin(input), 3)
    
    def test_two(self):
        input = [1, 2, 3]
        self.assertEqual(self.s.findMin(input), 0)

if __name__ == "__main__":
    unittest.main()

旋转数组的最小值(数组包含重复值)

  1. left=0,right=length-1,求mid = (left+right)/2
  2. 如果arr[mid]==arr[left] and arr[mid] == arr[right],那么因为无法判断哪边有序,只能转换为顺序查找;
  3. 判断arr[left]<=arr[mid]来确定是否左边有序(注意这边一定要等号,因为mid总是靠近left),否则表示另一边有序,如果左边和右边皆有序,那么最小值一定是arr[left]
  4. 如果左边有序,则left=mid,如果右边有序,则right=mid,终止条件为两个leftright相邻,此时left是前面子数组的最后一个,right是后面子数组的第一个,此时返回right

注意:如果选择旋转数组旋转为0,即本身有序,那么上面方法就会失效,因此在之前判断数组本身是否有序。

import unittest

class Solution:
    def findMin(self, nums):
        """
        :type nums: List[int]
        :rtype: int
        """

        if len(nums) == 0:
            return -1
        #数组本身有序
        if nums[0] <= nums[-1]:
            return nums[0]

        l,h = 0,len(nums) - 1

        while l < h:
            m = l + (h-l)//2

            if nums[l] <= nums[m]:
                #左边有序
                if nums[m] <= nums[h]:
                    # 右边有序
                    return l
                else:
                    l = m+1
            else:
                #右边有序
                h = m
        return l


class TestSolution(unittest.TestCase):
    def setUp(self):
        self.s = Solution()

    def test_one(self):
        input = [4,5,6,1,2,3]
        self.assertEqual(self.s.findMin(input), 3)
    
    def test_two(self):
        input = [1, 2, 3]
        self.assertEqual(self.s.findMin(input), 0)

if __name__ == "__main__":
    unittest.main()

做了以上这些题目,可以总结出以下要注意的点

  1. 解题思路:考虑初始、循环和终止过程,循环过程根据目标值存在于哪个子数组来更改leftright
  2. 如果存在使left=mid的情况,需要干预循环结束条件,因为在leftright相邻时,left==mid,那么如果left=mid,会导致每次循环无法减少候选数组,最终导致死循环;
  3. 有时候需要在最外层判断指针指向的位置是否符合条件,如循环结束条件为l < h - 1
  4. 循环数组的解题思路就是寻找有序子数组
  5. 对于旋转数组如果存在重复数导致无法判断前后哪个序列为有序,那么就要转化为顺序查找。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容