图片识别,人工智能模型的训练及识别

  一个3岁的小孩可以识别出鸟类的照片,然而最顶尖的计算机科学家们已经花了50年时间,来研究如何让电脑识别出不同的问题。漫画里的灵感就是这么来的。

在最近的几年里,我们终于找到了一种通过卷积神经网络(Convolutional Neural Networks来进行物体识别的好方法。这些个词听起来就像是从威廉·吉布森的科幻小说编造出来的,但是如果你把这个想法逐步分解,你绝对可以理解它。

  让我们开始吧,我们一起来写一个识别鸟类的程序。

万物皆“数”

结论其实极其简单。神经网络会把数字当成输入,而对于电脑来说,图片其实恰好就是一连串代表着每个像素颜色的数字。

短浅的目光

  仅仅把像素输入到神经网络里,就可以做出图像的识别,这很棒!机器学习就像魔法一样!对不对!!

  呵呵,当然,不会,这么,简单,呵呵呵。(Well, of course it’s not that simple.感受作者的神之鄙视吧哈哈哈)

  在机器学习这个领域中,有更多的数据总比一个更好的算法更重要!现在你知道为什么谷歌总是乐于给你提供无限量免费图片存储了吧? 他们,需要,你的,数据!!

卷积是如何工作的

  之前我们提到过,可以把一整张图片当做一串数字输入到神经网络里面。不同的是,这次我们会利用“位移物相同”(译者注:也就是平移不变性)的概念来把这件事做得更智能。

  下面就是,它怎样工作的,分步解释——

第一步:把图片分解成部分重合的小图块

  和上述的滑框搜索类似的,我们把滑框在整个图片上滑过,并存储下每一个框里面的小图块:

  这么做之后,我们把图片分解成了多块同样大小的小图块。

第二步:把每个小图块输入到小型神经网络中

第三步:把每一个小图块的结果都保存到一个新的数列当中

第四步:缩减像素采样

最后一步:作出预测

  所以从开始到结束,我们的五步就像管道一样连接起来:

95%准确是有多准确?

  我们的网络声称有95%准确。但是细节决定成败(devil is in the detail),这意味着各种各样问题可能产生。

  比如说,如果我们的训练数据有5%是鸟类而剩下95%不是呢?一个程序即使每次都猜“不是鸟”也能达到95%的准确率。这也就意味着这个程序并没有什么作用。

  相比于准确度,我们必须更多的关注在数字本身。为了判别一个分类系统有多好,我们需要知道它是怎样出错误的,而不是仅仅关注它错了多少次。

  与其只考虑我们预测的对与错,不如把我们的程序分解成四个不同的类别——

  首先,对于那些被我们的网络正确辨认为鸟类而且确实是鸟类的,我们叫他们“真正类(True Positives)”

  第二,被辨认为非鸟类,而且确实是非鸟类的,我们叫“真负类(True Negatives)”

  第三,被辨认为鸟类,但却是非鸟类的,我们叫“假正类(False Positives)”

  第四,被辨认为非鸟类,但却是鸟类的,我们叫“假负类(False Negatives)”

  下面的数据是使用那15000张验证图片,在每种类别中我们猜测的数量:

  为什么我们要把结果做上述分类呢?因为并不是每一个错误产生的几率都是一样的。

  设想如果我们写一个通过MRI图像来探测癌症的程序。如果我们探测到了癌症,我们更希望它是“假正类”而不是“假负类”。因为假负类是最可怕的情况——那就是你的程序告诉你,你绝对没有病,但实际上你已经病入膏肓了。

  我们需要计算准确和召回指标(Precision and Recall metrics)而并不仅仅关注总体的准确度。准确和召回指标给了我们程序表现的一个清晰的反馈:

  这告诉我们,当我们猜“鸟类”的时候,97%的时候是正确的。但是这同时也告诉我们说,我们只找到了真实鸟类里面的90%。换句话说,我们可能不会找到每一只鸟,但是当我们找到一只鸟的时候,我们很确定它就是一只鸟!

关于我们

  小花儿人工智能(www.xiaohuaerai.com)是一家专注于图像识别技术的人工智能科技公司,为迅雷、映客、酷狗、秒拍、美图等数百家知名互联网企业提供高可用的图像识别云服务,产品包括图像内容审核、人脸识别、美颜&特效、主播分类、OCR证件识别、自然场景识别等。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容