导读
为了帮助飞桨内部同学更好地了解人工智能领域的最新资讯,每周二更新《AI行业态势感知》,从学术(论文和新思想、学术会议等),行业和政策(技术产业政策、项目基金申请、技术投融资等),人物(学者的人事变动和获奖情况)、数据(数据集),工具(新工具和应用推荐)等诸多角度,鸟瞰过去一周人工智能领域值得关注的动态。
过去一周(2020/09/07~2020/09/13),值得关注的内容有以下3方面:
1. TensorLayer项目发起人董豪以及核心开发骨干麦络:在AI框架领域,生态建设越来越重要,几个人打天下的时代已经过去,其背后是人工智能潮流正奔着技术和产业融合的方向滚滚向前;对于下一代AI开源框架,它的成功将是团队合作、国际视野、技术创新、市场落地和持之以恒的综合结果。(详情参见本周“观点”栏目)
2.【熊辉】预训练的语言模型在各种自然语言处理任务中都取得了巨大的成功。但是,由于缺少两个级别的领域知识,即短语级别和产品级别,BERT无法很好地支持与电子商务相关的任务。一方面,许多电子商务任务需要对领域短语的准确理解,而BERT的训练目标并未明确地建模此类细粒度的短语知识。另一方面,产品级别的知识可以增强电子商务的语言建模效果,但是它们不是事实知识,因此不加选择地使用它们可能会引入噪音。为了解决这个问题,近日研究者们提出了一个统一的预训练框架,即E-BERT。(详情参见本周“论文推荐”栏目)
3. TensorFlow上周开源了 TensorFlow Recorder 项目(也就是 TFRecorder),如此一来,数据科学家、数据工程师或 AI/ML 工程师只需几行代码即可创建基于图像的 TFRecords。使用 TFRecords 对于创建高效TensorFlow ML 流水线非常重要,而过去的创建方法非常繁琐。在 TFRecorder 之前,要大规模创建TFRecords,必须编写一个数据流水线来解析结构化数据,从存储中加载图像并将结果序列化为 TFRecord 格式。TFRecorder 允许您直接从 Pandas dataframe 或 CSV 写入 TFRecords,无需编写任何复杂的代码。(详情参见本周“竞品动态”栏目)
直接竞品动态:
Mindspore****:
MindSpore Study Group(MSG)自2020年7 月5日正式启动,已经在深圳、杭州、苏州和上海等多个地区举办MSG线下活动,并计划于9月在莫斯科和印尼举办MSG线上活动。
报名|四大实战来袭!第四期MindSpore两日集训营周六开课,等你报名~
MindSpore两日集训营自2020年5月发起,到9月第四期启动,平均每个月都能和同学们进行线上交流,收获良多。很多同学自MindSpore集训营开课起一期不落的坚持学习,并留言立志:“要集齐MindSpore训练营全套证书!”,相信ta的愿望一定会实现,而且还将掌握深度学习核心要点以及满屋子的MindSpore礼品。
MegEngine****:
TensorFlow****:
TensorFlow Recorder:更简易地创建TFRecords
TensorFlow上周开源了 TensorFlow Recorder 项目(也就是 TFRecorder),如此一来,数据科学家、数据工程师或 AI/ML 工程师只需几行代码即可创建基于图像的 TFRecords。使用 TFRecords 对于创建高效TensorFlow ML 流水线非常重要,而过去的创建方法非常繁琐。在 TFRecorder 之前,要大规模创建TFRecords,必须编写一个数据流水线来解析结构化数据,从存储中加载图像并将结果序列化为 TFRecord 格式。TFRecorder 允许您直接从 Pandas dataframe 或 CSV 写入 TFRecords,无需编写任何复杂的代码。
应对:我们是否在数据读取易用性方面是否需要产品化改造?
对飞桨有竞争压力的信息:
ONNX Runtime:微软做了一个ONNX Runtime的跨平台推理引擎,ONNX Runtime是一个跨平台的推理和培训加速器,与许多流行的ML / DNN框架兼容,包括PyTorch,TensorFlow / Keras,scikit-learn等。
应对:我们是否需要加入ONNX的指导委员会,以获得更大的话语权
1.3MB的超轻YOLO算法!全平台通用,准确率接近YOLOv3,速度快上45%丨开源
Msnhnet一款轻量的用于推理pytorch模型的框架,该框架受darknet启发,由国人编写,已支持Yolov5。该框架由纯c++编写完成, 不依赖其它第三方计算库, 同时也支持OpenBlas库,支持目前主流的操作系统,Windows, linux(Ubuntu测试)。支持目前主流的cpu芯片, Intel X86,和ARM.
PyCaret:开源的、低代码率的Python机器学习库
PyCaret是一个开源的、低代码率的Python机器学习库,它可以使机器学习工作流程自动化,同时,它也是一个端到端的机器学习和模型管理工具,可以缩短机器学习实验周期,将生产力提高10倍。与其他开源机器学习库相比,PyCaret是低代码量库的一个很好的选择,只利用几个单词,便可以用它来替换数百行代码,从而使得实验快速高效。
论文推荐
E-BERT:电商场景下的知识增强语言模型
E-BERT: A Phrase and Product Knowledge Enhanced Language Model for E-commerce
预训练的语言模型在各种自然语言处理任务中都取得了巨大的成功。但是,由于缺少两个级别的领域知识,即短语级别和产品级别,BERT无法很好地支持与电子商务相关的任务。一方面,许多电子商务任务需要对领域短语的准确理解,而BERT的训练目标并未明确地建模此类细粒度的短语知识。另一方面,产品级别的知识可以增强电子商务的语言建模效果,但是它们不是事实知识,因此不加选择地使用它们可能会引入噪音。为了解决这个问题,作者提出了一个统一的预训练框架,即E-BERT。具体地说,为了保留短语级别的知识,作者引入了Adaptive Hybrid Masking(自适应混合掩蔽),该方法使模型可以自适应地基于两种模式的拟合进度,从学习初步的单词知识转换为学习复杂的短语。为了利用产品级别的知识,作者介绍了一种邻居产品重建的方法,该方法通过去噪交叉注意力层训练E-BERT来预测与产品相关的邻居。作者在四个下游任务(即基于评论的问答,方面提取,方面情感分类和产品分类)中微调该模型,发现均可以取得优异的效果,由此证明了模型的有效性。
基于多任务深度学习的未知类别小样本高光谱图像分类
Few-Shot Hyperspectral Image Classification With Unknown Classes Using Multitask Deep Learning
现有的高光谱图像分类方法都假设和预定义图像分类系统是封闭且完整的,并在不可见的数据中没有未知的或新的图像类别。然而,这个假设对于现实世界来说可能过于严格,在构建分类系统时,通常会忽略新的类别。分类系统的封闭性会迫使模型在给定新样本的情况下指定标签,并可能导致对已知样本的标签的覆盖。为了解决这个问题,本文提出一种多任务深度学习方法,该方法可以在未知类别可能存在的开放世界中同时进行分类和重构。将重构数据与原始数据进行比较;且未被重构的数据被认为是未知的,并且由于缺少分类标签,这些重构数据在潜在特征中没有被很好地表示,故需要定义一个阈值来区分未知类别和已知类别;基于此,本文提出了两种基于极值理论的策略,分别用于少样本和多样本学习场景。该方法在真实高光谱图像上的测试结果获得了最优的结果,如在萨利纳斯数据的测试结果中使分类的整体精度提高了4.94%。通过考虑开放世界中未知类别的存在,该方法实现了在小样本背景下的更精确的高光谱图像分类。
自动分类器:基于自动机器学习的鲁棒缺陷检测器
Auto-Classifier: A Robust Defect Detector Based on an AutoML Head
缺陷检测在工业中有着举足轻重的地位,本文将AutoML引入其中,给未来工业落地提供了新的解决方案。在工业中,快速准确地检测,分类或者分割出图像中的缺陷部分是如今检测系统的难点,由于行业的要求不断变化,获取的训练数据也会带有各种各样的噪声,传统方法通常依赖图像中提取手工特征,以表示缺陷和异常。而本文使用NAS来设计自动分类器实现了100%的准确率。
观点
董豪&麦络:下一代AI开源框架,它的成功将是团队合作、国际视野、技术创新、市场落地和持之以恒的综合结果
目前国内外的AI开源框架领域,以TensorFlow、PyTorch、MindSpore等为代表,正处于一种群雄林立、七国八制的状态,但也增加了AI应用的平台移植成本,所以TensorLayer的问世难能可贵,它基于各个主流的开源框架,提供了一个统一的AI算法模型接口,不仅稳定了AI应用层,也促进了各开源框架的良序竞争。鉴于中国AI开源框架实力,整体尚处于一种相对薄弱的状态,那么对于正蓄势待发、投身于AI开源项目的学者或从业者们来说,TensorLayer有哪些值得学习的经验呢?为此,本文作者采访了TensorLayer的项目发起人董豪以及核心开发骨干麦络。通过董豪和麦络抽丝剥茧般的独到解析,笔者发现:在AI框架领域,生态建设越来越重要,几个人打天下的时代已经过去,其背后是人工智能潮流正奔着技术和产业融合的方向滚滚向前;对于下一代AI开源框架,它的成功将是团队合作、国际视野、技术创新、市场落地和持之以恒的综合结果。
行业与政策
清华大学AMiner发布计算机科学会议(期刊)影响力排名
为了更好地了解计算机科学领域会议和期刊的影响力,方便计算机科学领域的研究人员选择合适平台,清华AMiner发布了计算机科学领域的会议(期刊)的影响力排名。该榜单基于2015年1月到2020年7月五年多的数据,选取了六大指数,以中国计算机学会和清华大学发布的两种不同的计算机科学会议(期刊)榜单为基础,对会议(期刊)从学术影响力、产业影响力、TOP论文质量等多维度多角度进行综合性评估。
电子学会:中国服务机器人市场已占全球市场超1/4
中国服务机器人市场已占全球市场1/4以上,2020年我国服务机器人市场规模有望突破40亿美元,为服务业注入新活力。中国电子学会副秘书长梁靓介绍,2019年全球机器人市场规模约294.1亿美元,其中服务机器人94.6亿美元,同比增长14.1%;服务机器人获得领域内最快增长。2019年,中国机器人市场规模约为86.8亿美元,其中服务机器人市场规模为22亿美元。2014年至2019年,中国机器人市场平均增长率达到20.9%。
AI新药研发公司望石智慧A+轮融资数百万美元
望石智慧正在从事AI+小分子药物设计,该公司成立于2018年,其AI平台在药物知识挖掘、优势骨架发现与选择、分子生成与设计、性质预测等早期药物发现领域已具备一定技术优势。目前,望石智慧已具有基于AI技术的智能化分子设计平台及知识图谱两大核心产品,覆盖从新药发现到临床前研究的环节。
人物
以国家战略科学家身份,顶级AI学者朱松纯回国,筹建北京通用AI研究院
近日,知乎热帖称顶级 AI 华人学者、UCLA 教授朱松纯拟加入清华自动化系,职务为教研系列教授。经机器之心求证,此次朱松纯教授以国家战略科学家的身份回国,受邀筹建北京通用人工智能研究院并担任院长。同时,朱教授也将与北京大学、清华大学在相关领域开展研究合作。
2020青橙奖公布:两位智源青年科学家榜上有名
9月9日,2020年阿里巴巴达摩院青橙奖获奖名单公布,包括智源青年科学家杜子东、黄高在内的10位科学家榜上有名,他们将获得总计1000万元奖金。评审为智源青年科学家、中国科学院计算技术研究所副研究员杜子东撰写的获奖理由写道,“他的架构深度学习处理器,能高效处理广泛深度学习算法”。智源青年科学家、清华大学助理教授黄高的获奖理由为:“发明了新型神经网络架构,推动了深度学习的基础研究与技术应用”。
李开复称蚂蚁金服为旷视提供人脸数据:一场「口误」引发的冤案
9月12日的HICOOL全球创业者峰会上,李开复在发言中提到,早期帮助旷视科技公司寻找了包括美图和蚂蚁金服等合作伙伴,让他们拿到了大量人脸数据,帮助他们分析各个行业怎么切入,并在随后的摸索过程中找到了几个有价值的商业化方向。蚂蚁集团率先通过微博做出回应蚂蚁集团在与旷视科技合作事宜上从未与李开复先生有过接触。
代码及开源项目
国家博物馆纳入了几件与众不同的藏品:来自阿里团队的三行代码
本次藏品征集中,阿里提交了包括 4 本新型冠状病毒肺炎临床救治手册、2 本新冠疫情爆发下的医院应对策略、六大洲捐赠的提单和报关单、等 14 种共 30 件抗疫实物。这其中,有三件「物品」与众不同,它们分别是:支付宝团队研发的健康码系统第一行代码;阿里云研发的全国健康码引擎第一行代码;阿里巴巴达摩院研发的新冠肺炎****CT****影像****AI****辅助诊断产品第一行代码。
基于双重任务一致性的半监督医学图像分割模型
基于深度学习的半监督学习算法已经在医学图像分割中取得杰出的结果,并且SSL算法通过学习未标记数据可以减少医生花费昂贵的注释。然而,现有文献中的大多数SSL算法倾向于通过扰动网络和/或数据来规范模型训练。并且现有的多/双重任务学习涉及固有预测扰动的各种级别的信息,基于此,本文提出这样的问题:是否可以显式地构建任务级正则化函数,而不是隐式地构建网络和/或数据级扰动和转换用于SSL吗?为了回答这个问题,本文首次提出了一种新颖的双重任务一致性半监督框架。具体来说,该框架使用双重任务深度网络,共同预测目标的像素级分割图和可感知几何的水平集表示。通过可区分的任务变换层,将水平集表示形式转换成近似的分割图。同时,针对标记和未标记的数据的水平集衍生的分割图和直接预测的分割图之间引入了双重任务一致性正则化。在两个公共数据集上的大量实验表明,通过合并未标记数据,本文提出的方法可以大大提高医学图像分割性能。同时,该框架在精度、网络参数和计算成本方面都优于最好的效果最先进的半监督医学图像分割方法。
通过无监督特征提取改进自组织映射
自组织映射对无监督学习有很好的启发作用,它模拟人脑中处于不同区域的神经细胞分工不同的特点,而且这一过程是自动完成的。本文通过使用提取的特征而不是原始数据来提高自组织映射的性能,并且使用基于梯度学习的稀疏卷积自动编码器的机器学习方法和使用基于脉冲时序相关可塑性学习脉冲神经网络的神经科学方法。最后将自组织映射分类提高了6.09%,并达到了无监督图像分类的最新性能。
教程
哈佛大学:《从零开始学习机器学习》
该书是为读者学习新的机器学习算法或了解更深层次的算法。具体地说,它是为那些有兴趣学习机器学习算法的读者准备的。这些推导可能有助于读者,特别是对基础算法不熟悉的读者,可以更直观地理解它们是如何工作的。或者,这些推导可以帮助有建模经验的读者理解不同算法是如何创建模型,以及每种算法的优缺点。
李航《搜索与推荐中的深度学习匹配》新书
本文系统全面地介绍了最近发展起来的搜索推荐深度匹配模型。首先给出了搜索和推荐匹配的统一观点。这样,两个领域的解决方案就可以在一个框架下进行比较。然后,调查将目前的深度学习解决方案分为两类:表示学习方法和匹配函数学习方法。介绍了搜索中的查询-文档匹配和推荐中的用户-项匹配的基本问题和最新的解决方案。该调查旨在帮助搜索和推荐社区的研究人员深入了解和洞察空间,激发更多的想法和讨论,促进新技术的发展。
新工具
地平线发布全新一代AIoT芯片“旭日3”
从GPU被用于人工智能计算开始,AI芯片在10多年时间里迅猛发展。在算力和数据呈指数级增长的背景下,人工智能应用场景越来越多,终端对效能的要求也越来越高。今天,中国AI芯片独角兽地平线,发布了全新一代AIoT边缘AI芯片“旭日3”。旭日3将其计算特点融入到架构设计当中的芯片。与其它典型的AI芯片相比,地平线的AI芯片始终能够保持相当高的有效利用率,将算法创新的优势发挥到极致。目前在图像分类任务上,旭日3可以有效适配Google提出的EfficientNet等最先进的网络,性能超越业内领先的11.4TOPS算力的芯片。
应用
李飞飞团队在Nature上发文:用“环境智能”来改善医疗环境
近日,斯坦福大学教授李飞飞团队在Nature上成功发表了一篇关于利用AI传感器和AI算法帮助改善患者和临床医生医疗服务的文章。论文的题目为“Illuminating the dark spaces of healthcare with ambient intelligence”。在该篇论文中,研究人员回顾了这项技术如何改善我们对隐性黑暗的,未观察到的医疗空间的理解。
DeepMind与Google通过AI提高Google Maps预测能力
Google Maps是使用最广泛的地图app之一,其能预测交通情况的能力使其成为许多司机不可或缺的工具。近日,DeepMind宣布与其合作,帮助Google Maps变得更准确。具体来说,Google Maps会分析世界各地道路的实时路况,以计算出ETA,这可以为平台提供当前路况的图片,但不考虑驾驶员可能希望在行驶路线上看到10、20或50分钟的情况。Google Maps依靠机器学习来将交通状况与全球道路的历史模式结合起来,并利用了一种图神经网络(GNN),成功提升了谷歌地图在柏林、东京、悉尼等大城市的实时ETA准确率,最高提升了50%。
芝加哥大学让人脸识别失灵的新AI
芝加哥大学沙地实验室的科学家们创建了一个叫“福克斯”Fawkes的技术,诞生的新兴技术极有可能终结私人照片被高科技公司利用这一现象。该程序主要使用AI技术,可以神不知鬼不觉地修改你的照片,以欺骗面部识别系统。