“横空出世,莽昆仑,阅尽人间春色。飞起玉龙三百万,搅得周天寒彻”。气势磅礴的连绵山脉和源远流长的文化、精神沉淀,使昆仑山成为了当仁不让的“万山之祖”。如今,在这座千年的山脉之外,又有一股全新的“昆仑”之力在崛起。
在今天的百度AI开发者大会上,向来低调的李彦宏亲自发布了自主研发的全新AI芯片——“昆仑”。提及这款产品,不善言表的他有些激动:“中国改革开放40年来,迎来了中国IT产业的爆发式增长,但是高端芯片一直依赖进口,这是我们这一代IT人心中永远的痛。当进入人工智能时代,情况将会发生改变。百度自主研发的高端芯片,将去满足全世界开发者的各种需求,支撑十几万开发者为社会造福。”
撰文 | 钱皓,何玉嘉亦有贡献
排版 | 千亦
一、“昆仑”何以为成新“高峰”?
“昆仑”是迄今为止业内设计算力最高的AI芯片(100+瓦特功耗下提供260Tops性能)。其在大规模AI运算实践中诞生,基于百度8年CPU、GPU和FPGA的AI加速器研发,经历20多次迭代,是中国AI芯片的又一里程碑。
立足两大核心亮点,“昆仑”成首款“云端全功能”AI芯片。
一是适配场景很丰富,凸显“全功能”特征。其能高效满足同时训练和推断的需求,除了常用深度学习算法等云端需求,还能适配诸如自然语言处理,大规模语音识别,自动驾驶,大规模推荐等具体终端场景的计算需求,通用性更高。
这与百度拥有丰富的AI场景密不可分,包括语音、图像、DuerOS、无人车、Feed推荐等。正是不断基于这些场景和算法进行优化、学习和训练,才使“昆仑”具备了和多元场景无缝对接的通用能力。
二是上天入地,“云端一体化”不容忽视。简言之,“昆仑”既可应用于数据中心、公有云等“云”的场景,也能应用于无人车测试研发等“端”的场景。
性能卓越,相较谷歌、寒武纪芯片,毫不逊色且更胜一筹。
相较谷歌TPU3.0,“昆仑”具备多场景算力优势,以及更强的兼容能力。谷歌TPU3.0拥有更高的半浮点计算能力,而“昆仑”的优势在于采用领先的混合精度方法,使得自身算力在多场景下能达到前者的2-3倍。并且,TPU3.0采用芯片间互联,而“昆仑”采用了pcie fabric互联,能更好的和目前IDC环境兼容。
相较寒武纪MLU100,“昆仑”通用性更强。MLU100虽然为首款云端AI芯片,主要用于机器学习,满足计算机视觉、语音、自然语言处理、数据挖掘等云处理任务。“昆仑”则在此基础上,强化了“全功能”特征,能满足丰富的具体场景计算需求。
二、百度造“芯”的考量
从外部机遇来看,造“芯”无疑能抢占产业链的制高点,同时也符合国家战略诉求。
宏基创始人施振荣曾提出了著名的“微笑曲线”,其形象地描绘了产业链中各环节的附加值表现,核心环节集中在两端,即研发和品牌,中间制造、分销等环节附加值极低。以iPhone 6s为例,其物料成本为234美金,而各类芯片成本占比过半,达127美金。
随着大数据、人工智能的崛起,需要AI运算处理的数据,差不多每24个月就至少增长一倍,建构模型的复杂度是原来的五倍,与之相关,就需要计算能力强大十倍芯片能及时跟上。这一计算能力的提升,需要算法、软件和硬件工艺相互配合共同来完成——这就是AI时代的新摩尔定律。
在该背景下,芯片的重要性更是不言而喻。因此,唯有扼住芯片的喉咙,才能真正掌握产业链的核心话语权,拿下产业最大的肥肉。
此外,立足芯片研发,能帮助中国扭转“缺芯少魂”的不利局面。当下,国内以芯片为代表的核心技术严重匮乏,八成以上的芯片都需从国外进口。除了中兴所处的通信产业,哪怕是看起来技术含量寥寥的电动车,控制器也并非自主研发。因此每当生产销售进入旺季,芯片供应商便会肆无忌惮、大幅涨价,国内企业也只能任人宰割。
不夸张地说,要是欧美日韩联合禁运芯片,国内的电子行业恐怕会彻底废掉。不说飞机、汽车、电器,连灯泡生产也将步履维艰。因此唯有龙头技术企业带头突破,才能打破国内高科技产业发展受制于人的局面。
从内部能力来看,百度毋庸置疑以技术研发著称,且All in AI的它需要不断满足日益增长的算力需求。
它拥有极强的技术基因,具备攻克芯片研发难关的硬实力。核心主业搜索背后,依赖的是知识图谱和机器学习能力。因此百度本身在数据、算力、算法维度上有较强的积累。
BAT三家中,阿里重运营、腾讯重产品、百度重技术已成业内共识。财报数据显示,2018年第一季度,BAT三家的研发投入占总营收比例分别为:阿里11%,腾讯仅6.8%,而百度高达15.78%,也显示了百度对技术研发的投入力度。技术天赋和后天努力的双重耦合,自然能使其在面对芯片这种高难度产品的研发压力时,做到游刃有余。
面对人工智能的新趋势,百度以All in AI的战略姿态进入,对超强运算力需求与日俱增。从2011年起,为了深度学习运算的需要,百度便开始了基于FPGA的AI加速器的研发。从那时起,基本上每年都能获得超过2倍的计算性能的提升。
而随着AI应用的爆发,运算能力要求越来越高。基于传统芯片的AI运算加速,有如杯水车薪,已经不能满足日益高涨的算力需求。在此背景下,百度必须要拿出AI大规模运算的更佳解决方案,换下蹩脚车胎,使AI这辆大车翻山越岭再无障碍。
三、补全AI生态版图,丰富产业赋能维度
新落一座昆仑山脉,大地的温度、降水,甚至气候都将受此影响。百度此番推出“昆仑”芯片,不仅将推动自身的AI生态布局完善,更将赋能产业茁壮成长,并为国家弥补高端芯片受制于人的窘境,打开新的全球技术格局。
首先,打造一体化的AI生态链,将带来更强的协同效应,加速百度All in AI战略落地。
人工智能产业链中,最底层的技术支撑层包含三大要素,即数据、算力和算法,分别对应传感器(硬件)、AI芯片(硬件)以及算法模型(软件)。
在算法维度,百度已拥有自主研发的PaddlePaddle深度学习框架。而此次“昆仑”芯片的发布,将推动算力呈现爆发式增长,并使得三大AI要素耦合发力。更重要的是,造芯还使其以“百度大脑”为核心的底层技术架构上,具备了更完善的软硬件一体化能力,驱动AI生态加速完善。
其次,此举对产业的赋能也将更加多元化。
再看AI产业链,百度力推“昆仑”芯片,强化运算力。这将与PaddlePaddle一道,向行业输出更全面多维的底层技术能力。
而在基础应用层,百度大脑已开放语音识别、图像识别、视频识别、数据智能等多维度能力。此次百度大脑3.0再次输出“多模态深度语义理解”能力,为产业迭代再添助力。另外,百度还通过DuerOS、Apollo生态,提供了面向语音交互、自动驾驶等具体场景的解决方案。
至此,百度的AI赋能维度从上至下,已覆盖AI全产业链,这将为产业繁荣带来极大的助力。就像一台笔记本,若是芯片、硬件、操作系统,以及于应用都出自同一家,协同性也更强,自然运算效率也更高。
最后,百度正在为“中国+AI”赋予新的意义。
“昆仑”以迄今行业设计算力最高的地位,使中国在AI芯片领域具备了与谷歌等国际巨头,一较高下的实力。在国内“缺芯少魂”的高墙上,打出了一个突破口。这也将进一步激励国内同行,打破对自身的限制,共同投入到对芯片等核心技术的研发中。
同时,作为人工智能产业链的核心技术,芯片的突破将为包括智能音箱、自动驾驶等垂直领域的AI落地,提供更强劲的动能。使得中国在人工智能时代,站上世界舞台的最中央。
四、结语
横空出世的“昆仑”,或许真能如诗中所言睥睨千野、“搅得周天寒彻”,在国内核心技术研发,甚至于全球AI芯片史上,留下浓墨重彩的一笔。