还记得阿里巴巴版的NASA计划吗?今年3月初,阿里巴巴董事局主席马云宣布启动内部代号为“NASA”的计划,将面向未来20年组建强大的独立研发部门,建立新的机制体制,为服务20亿人的新经济体储备核心科技。而在3月29日的阿里云云栖大会深圳峰会上,“NASA”计划的首个重磅武器也浮出水面!
新武器就是——机器学习平台PAI2.0。1.0版本是两年前阿里云对外发布的国内首个机器学习平台,两年时间里,PAI在阿里巴巴内部已经被广泛使用。以淘宝搜索为例,搜索结果会基于商品和用户的特征进行排序。通过使用参数服务器,淘宝可以把百亿个特征的模型,分散到数十个乃至于上百个参数服务器上,打破规模的瓶颈。
此次版本的重大升级,标志着阿里云在构建AI核心技术能力上又进一步,而阿里的“NASA”计划将为PAI平台使用者提供强大的技术后盾。简要来概括2.0的优势,便是:更丰富的算法库、更大规模的数据训练和全面兼容开源的平台化产品。据阿里云方面介绍,相比1.0版本,PAI 2.0有多项重大更新,除增加了100余种算法外,更重要的是对主流深度学习框架TensorFlow、Caffe和MXNet的全面兼容。
一些小编不是很能看得懂的内容将在【浙江新闻+】中分享给能看得懂的各位读者,但通俗解释的话,2.0版本要比1.0版本更兼容、更普惠,对开发者来说,人工智能的开发将以更亲近的方式展开。
也就是说,PAI可以大幅的降低人工智能的门槛以及开发成本。人工智能综合了多门学科的技术,对人才要求极其高,除了懂统计学中各种复杂的机器学习算法,还要懂实现逻辑以及分布式架构理论。但PAI的操作界面没有繁琐的公式和复杂的代码逻辑,用户看到的是各种分门别类被封装好的算法组件。每一个实验步骤都提供可视化的监控页面。在深度学习黑箱透明化方面,PAI也同时集成了各种可视化工具。
阿里云首席科学家周靖人说,在过去的一年时间里,阿里云协助客户落地了多项重大的人工智能应用。但人工智能要想真正成为成为普惠科技,需要一款更加通用的生产工具。PAI2.0正是为此而生。
在阿里巴巴倡导的“五新”中,阿里云毫无疑问是新技术的担纲。3月23日,马云在马来西亚谈及“NASA”计划时表示,科技是创造未来的关键,投入技术研发是希望让科技更加普惠,能让更多的人收益,“我们对一些很奇特但无法持久的技术不感兴趣。我们希望投资在那些能让人更有创造力的技术上。我们认为技术是要为人所使用,而不是人为技术而工作。”
在今天的云栖大会·深圳峰会上,阿里云也宣布了一系列新成果和亮点,以下为盘点:
1.合并优酷CDN业务 降价35%
3月29日阿里云宣布完成对优酷CDN及视频云业务和团队的整合。据悉,合并后的阿里云CDN整体带宽能力超过40T,全球节点超过1000个,业务规模跃居中国第一,与全球巨头Akamai旗鼓相当。
同时,阿里云视频云总经理朱照远宣布CDN开始新一轮的大幅降价。此次阿里云CDN官网降价降幅最高可达35%,流量单价最低只需0.17元/GB。此外,带宽计费规则从原来的超额累进调整为阶梯到达,更加有利于消费者。2015年5月,阿里云曾宣布CDN降价21%,调整后的价格对比传统CDN厂商价格接近“腰斩”,引发市场激烈反应。目前,阿里云CDN服务了超过20万家企业客户,包括人民网、映客、CNTV、芒果TV、今日头条、新浪微博、知乎、豆瓣、熊猫TV、PPTV等。
会上,阿里云还发布了整合优酷资源后的全新视频云解决方案,全面覆盖金融、电商、医疗、教育等诸多领域,一站式提供海量存储、高效分发、极速网络、视频AI等强大服务,广泛适用于短视频、游戏直播、娱乐直播、泛生活直播、教育直播、远程医疗、企业远程视频会议等场景。
2.实现首个云上量子加密通讯服务
量子加密通道将成为未来互联网重要的基础设施之一,阿里云今日公布了首个云上量子加密通讯案例。
据了解,网商银行的一组信贷业务数据率先进行了云上量子加密通讯的远距离传输“实战”。该贷款需要运用到大量的数据计算来给客户授信,服务的客户都是散落在各地的小微经营者,对数据是否安全抵达数据中心提出了极高要求。据技术人员介绍,该次传输在城域之间的专有云通道进行。通过对信息采用量子密钥加密,并使用量子技术对密钥进行分发,保障了数据的不可破解和密钥传递过程中的不可窃取或篡改。
自此,阿里云成为全世界第一家可以提供量子加密信息传送服务的云计算公司,也是最安全的网络服务提供者。
量子科学被视为新一代网络信息技术的关键技术,相比传统的信息安全技术,量子通信能做到数据传输的绝对安全,当前尚无计算能力进行破解,可解决信息传输的安全问题。也正因为此,量子通信的实用化和产业化已经成为各大国争相追逐的目标。
由于成本昂贵,量子通信此前仅用于个别科学实验。两年前,阿里云和中国科学院在上海成立量子计算实验室,探索超越经典计算机的下一代超快计算技术。随后,阿里云与中国科学院旗下的国盾量子联合发布了量子加密通信产品--量子加密通道,使量子加密技术成为一种共享资源。据悉,阿里量子团队拥有二十余项量子通信应用相关专利。未来,阿里还将探索量子信息技术与区块链、人工智能等技术的结合应用,目标是让前沿领域的科研成果通过云计算的方式,成为普惠科技,实现大规模产业应用。
3.华北3地域超大规模数据中心正式对外开放运营,云服务器ECS全系列降价20%。
这是阿里云在全球开服的第14个地域。阿里云华北3所在的节点是目前国内最大的下一代超大型云计算数据中心,采用定制处理器、存储、服务器等高规格硬件和自主研发的飞天操作系统,综合发挥最大的计算效率,实时处理海量数据。同时,新节点采用风能、太阳能等先进节能技术,可将能耗比(PUE)控制在1.25以内,最低可达1.13,优于国家标准40%,相当于每年可节省5.9万吨的碳排放。
“华北3的开服将进一步释放阿里云的规模和技术红利。”阿里云飞天研发负责人李津表示,用户将享受降价20%的优惠。作为全球云计算基础设施最完善的服务商之一,阿里云目前在全球开放了14个服务区域节点,包括中国(华北3个、华东2个、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本,均部署阿里云自研的飞天操作系统,并提供中、英、日三种语言支持。
半年内,阿里云已进行过多次产品降价——
2016年10月,宣布中国区云产品全线下调,核心云产品最高降幅达50%,并推出“免费套餐”;
2016年双11,阿里云降价促销,当天完成了1.9亿元的销售,相当于24小时卖空一座数据中心,为数万家企业节省超过11亿元的IT成本;
2016年12月,阿里云再次宣布降价,中国区云数据库产品平均降幅达20%。
【浙江新闻+】
在阿里云的客户当中,广东省气象局对PAI的使用最具代表性。他们使用PAI对临近预报(0-3小时内)的降雨量进行建模预测。通过拖拽操作就完成了数据清洗、特征工程,非线性机器学习算法训练以及结果评估的工作。PAI还被应用在各种前沿科技领域。华大基因联合阿里云科学家,正使用PAI对肺腺癌患者基因进行分析,试图寻找到导致肺腺癌病发的关键基因突变。
好了,以下是一些小编不是很能看得懂的内容,分享给能看得懂的各位读者:
此次PAI2.0的重大升级主要包括以下方面:
全面拥抱开源
PAI2.0编程接口完全兼容深度学习框架:Tensorflow、Caffe以及MXNet,用户只需要将自己本地编写的代码文件上传至云端就可以执行。
Tensorflow、Caffe和MXNet是目前全球主流的深度学习开源框架。Tensorflow开源算法和模型最丰富;Caffe是经典的图形领域框架,使用简单;MXNet分布式性能优异。
对于底层计算资源,PAI2.0提供了强大的云端异构计算资源,包含CPU、GPU、FPGA。在GPU方面,PAI2.0可以灵活实现多卡调度。
借助这些框架以及强大的计算资源,用户能非常方便地就可以将计算任务下发到对应的分布式计算机群上,实现深度学习模型训练与预测。
更丰富的算法库
PAI2.0提供100余种算法组件,涵盖了分类、回归、聚类等常用场景,还针对主流的算法应用场景,提供了偏向业务的算法,包含文本分析、关系分析、推荐3种类别。
“算法全部脱胎于阿里巴巴集团内部的业务实践,所有算法都经历过PB级数据和复杂业务场景的锤炼,具备成熟稳定的特点”,阿里云首席科学家周靖人说。
支持更大规模的数据训练
PAI 2.0 新增了参数服务器(Parameter Server)架构的算法。不仅能进行数据并行,同时还可将模型分片,把大的模型分为多个子集,每个参数服务器只存一个子集,全部的参数服务器聚合在一起拼凑成一个完整的模型。
其创新点还在于失败重试的功能。在分布式系统上,成百上千个节点协同工作时,经常会出现一个或几个节点挂掉的情况,如果没有失败重试机制,任务就会有一定的几率失败,需要重新提交任务到集群调度。PS算法支持千亿特征、万亿模型和万亿样本直至PB级的数据训练,适合于电商、广告等数据规模巨大的推荐场景。
PAI的基础设施和计算框架建立在阿里云飞天计算平台之上,通过云的模式大幅降低了计算成本,支持MR、SQL、MPI、PS、GRAPH等多种分布式计算框架,对于底层的CPU和GPU计算机群可以灵活调用。
【本文由“ 六月六雨科技”发布,2017年04月15日】