强化学习的进展速度远远低于深度学习。 虽然OpenAI Five和谷歌的AlphaGo等有值得注意的新闻突破,但实际情况下的强化学习实践并未发生。
正如谷歌AI的团队在这篇博文中提到的那样,开发这类算法需要大量的实验而没有任何明确的方向。 不幸的是,大多数现有的框架都没有这种灵活性。 如果你在这个领域工作或研究过,你就知道重现现有方法有多困难(如果不是不可能的话)。
因此,为了帮助加速研究,并希望让社区更多地参与强化学习,Google AI团队开放了一个名为Dopamine的TensorFlow框架,旨在通过使其更灵活和可重复性来创建研究。 根据团队的官方文档,他们的设计原则是:
简单的实验:帮助新用户运行基准实验
灵活的开发:为新用户提供新的创新想法
紧凑和可靠:为一些较旧和更流行的算法提供实现
可重复:确保结果可重复
意识到新人们根据基准检查结果的重要性,研究人员还发布了整个培训数据。 它可用作Python pickle文件,JSON文件和用户可以可视化每个训练迭代的网站。
我们对此有所了解
请注意,DeepMind对多巴胺的研究与Google AI的这项工作无关。 虽然两者都在很大程度上植根于强化学习,但Google AI通过公开采购的方式参与了整个社区。 它肯定有助于它以TensorFlow为基础,这是深度学习社区中每个人都熟悉的框架。
强化学习可能是一个令人生畏的主题,但我鼓励大家尝试一下。 这个领域仍然具有潜力,并将在未来几年取得很大进展。 这是一个很好的入门资源,您也可以参考我们的文章了解初学者。
如果你想更加了解TensorFlow,或者说想实践一下人工智能项目,谷歌的另一款工具或许可以帮到你,也就是谷歌的AIY Projects 项目。
在2017 年上半年,谷歌宣布了一个新的开源计划--AIY Projects(AIY计划),其目标是让每个Maker(创客)都能DIY自己的 AI 人工智能产品,让更多人能学习、探索并体验人工智能。AIY 全称是 Artificial Intelligence Yourself,顾名思义就是利用 AI 来进行的 DIY 功能套件。借助 AIY 项目,创客可以利用人工智能来实现更像人与人交流的人机交互。谷歌目前为 AIY Projects 推出了两款硬件产品--AIY Voice Kit 和 AIY Vision Kit。
AIY Vision Kit(视觉套件)是一套简单的计算机视觉系统,可运行 3 种基于 TensorFlow 的类神经网路模型应用程序。
这次 AIY 计划推出两款新品,Edge TPU 是谷歌专用的 ASIC 芯片,专为在 Edge 运行 TensorFlow Lite ML 模型而设计, 用来处理 AI 预测部分。它的特点是比训练模型的计算强度要小。而且 Edge TPU 还可以自己运行计算,不需要与多台强大计算机相连,因此应用程序可以更快、更可靠地工作。它们可以在传感器或网关设备中与标准芯片或微控制器共同处理 AI 工作。针对Edge TPU的新设备是:AIY Edge TPU Dev 开发板和 AIY Edge TPU 加速器,二者皆采用 Google 的 Edge TPU 芯片。