刚过去的八月里图形游戏业界hin热闹,最高专业盛会Siggraph刚在温哥华胜利闭幕,紧接着科隆游戏展。这可忙坏了我们可敬可爱的NV话事人,GPU大佬,两弹元勋,黄教主,老黄--黄仁勋。秉承每逢盛会扔核弹的优良传统,老黄跨越万里,连续两场高强度keynote演讲。55岁的他身着标志性的黑色夹克战衣,全程火力输出,游刃有余。让人叹服世间还是有不会被油腻被枸杞茶养生杯腐蚀的大英雄。
辛苦归辛苦,老黄心里绝对美滋滋,世界首创的光线追踪(Ray-Tracing)GPU连续占据了专业和消费两大市场C位。针对专业用户Quadro RTX产品线中,最顶级的RTX 8000 GPU一块卖整一万美刀,老黄还觉得卖得太便宜,称之为”steal”。而在游戏领域,NV凭借2016发售Pascal架构的1000系列显卡已经占尽优势,此番GeForce RTX 2000系列一出,更是一骑绝尘,唯一的竞争对手AMD能否在年内拿出稍稍能打一点的竞品也是未知。看现在老黄躺GPU聚宝盆里数钱到手软的好日子,有谁能想到就在十年前,NV的形势还是岌岌可危,在英特尔发动的灭国绞杀战中风雨飘摇,甚至连GPU的未来都蒙上了一层阴影。
自从微软和英特尔羽翼丰满,取代曾经的带头大哥IBM后,PC生态圈泾渭分明,软件以微软马首是瞻,硬件上英特尔几乎说一不二。道理很直接,大部分PC中的组件都是围绕着CPU这个核心转,不是帮CPU处理I/O这些周边工作,就是最终仰仗CPU才能完成计算任务。掌握了CPU,真的就可以为所欲为。英特尔曾经连续数代CPU更新换代的的同时更换接口设计,针脚数在1150,1155,1156,1366间翻来覆去。而高端型号又单独搞一套,同一代不同层级的CPU之间接口不兼容,不同代的处理器看着针脚数一样还是不兼容。用户要购买升级CPU都必须同时投资搭载了相应芯片组的新主板,英特尔一鱼两吃,日子过得悠哉悠哉。
偏偏这样的舒心日子,有人要来从中作梗。曾经众多PC组件中不显山不露水一员的显卡,本质公职也就是把CPU计算结果显示到屏幕上,突然遇到了大贵人。随着图形应用和游戏的发展,老黄正式打出了GPU这一名号。纵使形状上还是一块卡,GPU在PC整体计算能力中的比重和地位突飞猛进。随着PC市场整体停滞不前,游戏PC成了增长最客观的细分市场。玩家的更倾向于将资金投向GPU,经验证明GPU才是保证良好游戏体验的第一干将。整机配置中,GPU价格超过CPU和主板的总和已是寻常,发烧玩家使用多路GPU来追求最逼真的画面,最流畅的舒畅也是不计成本。
如果只是收入上的竞争,英特尔还不会当作心腹大患,毕竟一小撮游戏PC帆布聊天。真正让英特尔如坐针毡的是老黄扶GPU上位取代CPU成为主要计算引擎的大图谋。2007年NV的GPU通用计算框架CUDA一登场,就开始向英特尔的传统领域发起进攻。先是宣称视频编码速度比英特尔最顶级的CPU还要快上10倍。又提出游戏中碰撞检测等物理计算使用GPU加速后,更是把CPU甩在身后。天命注定,当时英特尔和NV各自收购了游戏物理计算引擎中的两个领头羊公司Havok和PhysX。这两家物理引擎的最重要区别也就在PhysX从一开始也是采用专用计算器加速的思想。原本的冤家都有新老大撑腰,一时间嘴炮横飞,激战连场,甚至于出现了某英特尔VP指名道姓要教教老黄数学的经典战例。
个人用户能从GPU计算收益多少的嘴炮没听,英特尔高性能计算的自留地已经被CUDA强挖了墙角根。在超算领域,软件兼容性,界面,并行编程的复杂度这些都不是大问题,或者自有高人搞定,GPU这样能够平行处理大量暴力浮点计算的狠角色实在太投缘了。很多专用的计算软件在将核心计算移植到CUDA后确实立刻得到了戏剧性的性能飞跃。各大超算方案纷纷倾囊购买大量的GPU和原先的CPU阵列组成混合方案。
英特尔渐渐感受到来自老黄的强大压力。这位公开场合穿黑色皮夹克远多于西装革履的,看着更像摇滚重型机车票友的大佬,对核心计算技术的热情,对远景的把握,在当今的科技圈少有人及,倒是透老一辈硅谷科技狂人的独特气质。英特尔恐怕之前还没有遇上过斗心如此之盛的对手,如何应付当时需要细细思量。
兵来将挡,水来土掩,用自己的GPU将NV的GPU打垮,英特尔不是没有想过。毕竟之前英特尔也曾经发布过唯一一块独立显卡i740,虽然不叫座,技术水平还是不逊色的。不过英特尔有更大的想法,你要用CUDA废我的高性能计算,我就要用自己最擅长的X86灭你满门。英特尔启动的Larabee项目,就是将众多经过优化的X86核心到一块处理器(manycore)上,这样宝贵的X86指令集就能助阵,理论上很多软件只要稍作调整就能坐享大规模平行加速的。而GPU做的核心工作—渲染,也可以顺理成章的作为一个软件在Larabee硬件上实现。到时谁还会用诘屈聱牙的CUDA?
只可惜,Larabee项目进行了每一年,英特尔就意识这个项目的规模和难度超出预计。以X86指令集为底本设计出能够大规模并行的众核处理器已经够棘手,现代图形库的微妙和繁多的特性,也令原先做显卡只不过是实现一个Larabee软件渲染器的豪言壮语变得不切实际。英特尔不得不放弃做在Larabee上构建GPU的计划,而将方向完全转移到了高技能计算上。之后催生的产品Xeon Phi命运如何按下不表,正面击败NV GPU的原定计划就此泡了汤。
(未完待续)