百度的AI能力产品化,走在国内前列。因工作关系,对国内BAT,各个AI领域的顶尖创业公司,以及国外的几个巨头,做了对比分析。百度的AI布局,既广也深,且中文NLP、自动驾驶方面有所超越,综合实力强劲。这不,就来百度AI大会听讲了。
1. 百度对AI的理解
百度对AI的思考是一张图。这张图,将AI分成了6个层次,基础-》感知-》认知-》平台-》生态-》应用。百度AI的研发重心,在平台及以下,对于AI应用开发商来说,百度是一个很好的伙伴...
从这张重要的片子,管中窥豹,看一看百度对AI的理解,和她的发展思路。
-重平台,轻应用
-AI的发展依托于云计算,两者融合共进
-NLP的应用更可能成为用户入口。NLP对于AI,就像浏览器相对于电脑,微信相对于手机
-生态伙伴扶持,将是百度AI商业化的战略重心
参考百度的AI布局图。
2. 80+ AI能力全覆盖
百度AI能力覆盖了语音,AR/VR,OCR、人脸识别、通用图像识别、扫黄,视频识别,NLU(含UNIT),知识图谱。不得不说,真的很全。除了推荐算法外几乎覆盖到了。国内外能做到这么全的,好像只有微软。
3. 语音
长语音识别挺不错。大会现场放了一段视频,百度一个员工,用阅读诗词和唱歌,演示长语音实时识别,结果识别精准。
btw,会下,因为没找到百度语音试用,顺手试了一下其他公司的产品。阿里小蜜,发现语音识别也是出奇得好。国内的初创公司思必驰,识别效果也不错。倒是苹果自带语音,差了许多。
4. OCR武装到牙齿
百度OCR已经做成了一个大板块。会上,演示了发票识别,医疗单据识别,还可以做自定义模板的OCR,都是些很实用的能力。
5. 图像(含视频)
大会现场演示了一个车辆识别的案例。拿着手机,对着受损的汽车拍两张照片,一张整车照,一张局部擦伤照,就可以算出损伤的价格。
视频上,除了通用识别能力外,还作了个整合演示案例。针对某个视频做分析,分析结果可以看到视频某个时间,出现什么人物,说了什么话。这东西,和公安部的天网视频采集系统来个合体,简直1Q84。
6. 人脸
百度的人脸识别,关键点数量仅支持72个点,似乎大不如Face++。不过这块我不是很懂,可求专家讲解。
说了百度的人脸解决方案业务架构。
讲了两个核心tips。一个是,通过用户分组,提高业务方案中人脸识别的准确率。另外,如何避免自家的用户信息泄露给平台。
7. NLP(NLU+知识图谱)
杭州站UNIT的研发团队没来,过去问,说是杭州人民的需求(电商、无人便利店、互金)多在人脸识别上...为我杭人脸产业打call
8. 扫黄
暴恐,政治敏感,色情识别等。正好,扫黄是我混饭吃的活计,以后找时间做个专门分享。
8. PaddlePaddle深度学习框架
划重点。放到最后讲的,一般是有预谋的。大会做了三个小时,全是男人,到了最后,换上一位美女小姑娘上台,专讲PaddlePaddle,满满的诚意,为什么?因为真的很重要...
目前国内有自研深度学习框架的,不多。有能力,有精力,并且肯砸钱的不多。但框架是真的重要。做AI基础能力的,没有属于自己的框架,就像造车没有自己的发动机,做手机没有自己的芯片,略显底气不足。八卦说,Face++有一套框架,基于Caffe改的。真假且不论,至少人家重视。
TensorFlow即将一统天下的时代,为了避免重演安卓悲剧,让我们欢迎PaddlePaddle这只大花瓣吧