算法解析(一)简介

年底了!!!过了一年的“总结”日子:日报总结、周报总结、月报总结。。在一年收尾之前也想把看过的算法总结一下,算是过一个完整的“总结”年。

算法是一组完成任务的指令。任何代码片段都可视为算法。算法很无聊,但也有很有趣的的部分。我们也可以用速度比较快的算法来解决有趣的问题。比如:我们先讨论二分查找,并演示算法如何能够提高代码的速度。在一个示例中,算法将需要 8 执行的步骤从40亿个减少到了32个!

tips : 这篇文章中使用的实例是用Python演示的。

(1)二分查找

实例引入:

当我们在客户端登录淘宝账户时,淘宝肯定是要核实你是否用其网站的账户,因此必须在数据库中查找你的用户名。如果你的用户名为 Kobe Bryant ,你认为淘宝会怎么查找你的账户呢?从 A 开始查找?显然不是。正常的逻辑是从中间开始查找。

这个一个简单的查找问题,我们完全可以用一种算法来解决问题,这中算法就是 二分查找

二分查找是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要 查找的元素包含在列表中,二分查找返回其位置;否则返回null。

通过一个简单的例子来说明一下二分查找的原理。


FE661CF6EDEDDB71C74DE6631ACCBD1C.jpg

我随机在 1---100 之间猜一个数字,你的目标就是以最少的次数猜到我选的数字。

建设你从1开始猜,那么猜的过程绝对美得不敢想象。。。。如果我选的数是99,岂不要猜到猴年马玉去了。这是简单查找,更准确的说是傻找。那么更佳的查找方式是哪种呢???

(1.1)更佳的查找方式

先从50开始猜,如果我说小了。一次就排除了一半的数字。


9C7A1766FE89075B7829734B82184E56.jpg

再猜75,如果我说大了。一次又排除一半的数字。


35AEB7063B4656825270949ADA2EE60C.jpg

接下来再猜63,依次排除。
...
...
...

不管我心里想的是哪个数字,你在7次之内都能猜到,因为每次 猜测都将排除很多数字!

这不是偶然!其中是有一定的规律:

一般而言,对于包含n个元素的列表,用二分查找最多需要log2n步
而简单查找最多需要n步

对数和幂

你可能不记得什么是对数了,但很可能记得什么是幂。log10100相当于问“将多少个10相乘 的结果为100”。答案是两个:10 × 10 = 100。因此,log10100 = 2。对数运算是幂运算的逆运算。

接下来用Python代码编写一个 二分查找
该代码的实现:给定数组、元素,找到这个元素在数组中的下标。

def binary_search(list, item):

    # 声明最低的下标和最高的下标
    low = 0
    high = len(list)-1

    while low <= high:
        # 首先获取中间值下标
        # 如果(low + high)不是偶数, Python自动将mid向下圆整。
        mid = (low + high)/2
        guess = list[mid]
        if guess == item:
            return mid
        if guess > item:
            high = mid -1
        else:
            low = mid + 1

    return None


# 测试
my_list = [1, 3, 5, 7, 9]
print (binary_search(my_list, 5))
#
print (binary_search(my_list, 10))

(1.2)运行时间

算法可以帮我们大大减少繁琐的步骤,但是不同的算法之间还是有“优良之分”的,这点从运行时间上可以做一下比较。

回到前面的二分查找。使用它可节省多少时间呢?简单查找逐个地检查数 字,如果列表包含100个数字,最多需要猜100次。如果列表包含40亿个数字,最 多需要猜40亿次。换言之,最多需要猜测的次数与列表长度相同,这被称为 线性 时间(linear time)

二分查找则不同。如果列表包含100个元素,最多要猜7次;如果列表包含40亿个数字,最多 需猜32次。厉害吧?二分查找的运行时间为对数时间(或log时间)。下表总结了我们发现的情况


D1F9711CF8D44171E1F54ECBC157247B.jpg

(1.3)大O表示法

大O表示法是一种特殊的表示法,指出了算法的速度有多快。谁在乎呢?实际上,你经常要 使用别人编写的算法,在这种情况下,知道这些算法的速度大有裨益。

(1.3.1)算法的运行时间以不同的速度增加

我们先来假设查找一个元素用 1 毫秒。使用简单查找时,检查100个元素,因此需要100毫秒 才能查找完毕。而使用二分查找时,只需检查7个元素(log2100大约为7),因此需要7毫秒就能查 找完毕。然而,如果要查找的列表可能包含10亿个元素,在这种情况下,简单查找需要多长时间 呢?二分查找又需要多长时间呢?

能不能这么认为呢?查找100个元素,简单查找二分查找的 15 倍的时间。当查找 10 个元素的时候,时间也保持这个倍数关系?

假如上述假设成立,10亿个元素的列表运行二分查找,运行时间为30毫秒(log21 000 000 000大约为 30),那么简单查找用时应该为450毫秒。事实却不是这样,简单查找需要 10亿 毫秒

为什么会用那么大的差距?因为 简单查找 与 二分查找 的增速不同。有鉴于此,仅知道算法 需要多长时间才能运行完毕还不够,还需知道运行时间如何随列表增长 而增加。

大O表示法指出了算法有多快。例如,假设列表包含n个元素。简 单查找需要检查每个元素,因此需要执行n次操作。使用大O表示法, 这个运行时间为O(n)。单位秒呢?没有——大O表示法指的并非以秒为单位的速度。大O表示法 让你能够比较操作数,它指出了算法运行时间的增速。

(1.3.2)一些常见的大O运行时间

下面按从快到慢的顺序列出了你经常会遇到的5种大O运行时间。

  • O(log n),也叫对数时间,这样的算法包括二分查找。
  • O(n),也叫线性时间,这样的算法包括简单查找。
  • O(n * log n),这样的算法常见一种速度较快的排序算法。
  • O(n2),这样的算法常见一种速度较慢的排序算法。
  • O(n!),这样的算法包括接下来将介绍的旅行商问题的解决方案——一种非常慢的算法。

下面按从快到慢的顺序列出了使用这些算法绘制网格所需的时间:


54F679EB004E9D914209662621106691.jpg

这里做了简化,实际上,并不能如此干净利索地将大O运行时间转换为操作数,但就目前而 言,这种准确度足够了。

  • 算法的速度指的并非时间,而是操作数的增速。
  • 谈论算法的速度时,我们说的是随着输入的增加,其运行时间将以什么样的速度增加。
  • 算法的运行时间用大O表示法表示。
  • O(log n)比O(n)快,当需要搜索的元素越多时,前者比后者快得越多。

总结:

  • 二分查找的速度比简单查找快得多。
  • O(log n)比O(n)快。需要搜索的元素越多,前者比后者就快得越多。
  • 算法运行时间并不以秒为单位。
  • 算法运行时间是从其增速的角度度量的。
  • 算法运行时间用大O表示法表示。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,002评论 6 509
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,777评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,341评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,085评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,110评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,868评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,528评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,422评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,938评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,067评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,199评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,877评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,540评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,079评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,192评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,514评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,190评论 2 357

推荐阅读更多精彩内容

  • 一些概念 数据结构就是研究数据的逻辑结构和物理结构以及它们之间相互关系,并对这种结构定义相应的运算,而且确保经过这...
    Winterfell_Z阅读 5,836评论 0 13
  • --- layout: post title: "如果有人问你关系型数据库的原理,叫他看这篇文章(转)" date...
    蓝坠星阅读 793评论 0 3
  • Shuffle 基本概念 概述: Shuffle描述着数据从map task输出到reduce task 输入的这...
    平凡的小Y阅读 2,380评论 0 1
  • 盛世单机-一触即发,谁与争锋
    ipursuitveux阅读 355评论 0 0
  • 好久都没有像现在一样清醒了,决定写点什么记录下一路的心情。 经历了漫长的孤独与等待,我终于懂得什么才是自己真正重要...
    和春天有约阅读 1,781评论 40 49