NCP：19个神经元完成自动驾驶？

“究竟是标题党还是确有其事？”

10月13日，MIT的计算机科学与人工智能实验室的一篇推文吸引了我的注意力（见下图）：自动驾驶汽车只用了19个控制神经元。

图源MIT CSAIL人工智能实验室官推

研究成果的论文Neural circuit policies enabling auditable autonomy[1]发表在Nature的子刊Machine Intelligence (以下简称NMI)。

PS. 前两年NMI刚被推出时，还曾被一众学者抵制，原因是：无论是访问还是发表文章，都需要付费，这不利于社区的进步。

图源[2]

01 背景知识

由于这篇论文用了一些不同于现代神经网络的一些方法，为了更好的解读，需要先就一些背景知识和大家达成一致。

C. elegans线虫：秀丽隐杆线虫的整个身体中，只有约1000个细胞，且其中1/3是神经元，属于一种拥有非常简单神经系统的生物（见下图）。尽管简单，但其仍具有基本的运动、导航能力。因此，对神经网络研究学者而言，了解线虫的神经网络工作原理，对了解动物神经网络工作原理、设计人工神经网络有帮助。对自动驾驶的规划控制而言，或许也存在借鉴意义。

图源[3]

论文中借鉴了这种线虫的神经网络模型结构和数学模型：由感官神经元接收环境信息、而后经过中间神经元，传递给指令神经元进而形成决策信息，最后由动作神经元完成决策的执行并完成动作。

PCA, Principal Component Analysis，主成分分析：一种数据降维的方法，可以用于从数据中挑选出最少的维数来概括最重要的特征。

图源[4]

如上图，样本在u1方向上的投影方差较大，在u2方向上的投影方差较小。在信息和特征的意义上，便可以认为u1方向蕴含更丰富的信息和特征。论文中用PCA方法可视化的解释了模型主要学习到的知识维度。

Saliency map，显著图：可以用于模型的解释。模型的梯度的大小可以用于表示某个像素点发生一点改变后，对最终结果产生影响的大小。因此，通过对模型的中间层梯度进行显著图的可视化，可以判断图像中的像素点对于模型结果的影响或者作用。论文中使用显著图定性分析神经网络模型所关注的特征。

下图为显著图的一个示例，左一为原图，左二为显著图，右二为阈值化处理后的显著图，右一为利用显著图结果在原图上分割出的模型关注区域。

图源[5]

SSIM, Structural SIMilarity，结构相似性：通过对图像的亮度、对比度和结构进行建模，用以衡量两幅图像的相似度。论文中使用SSIM来分析在加入噪声前后，显著性图的变化程度，即模型的鲁棒性程度。SSIM越接近1，显著性图在噪声影响下变化程度越小，即模型鲁棒性越高。

给定两个图像x和y，两张图像的结构相似性可以按照下式求出：

其中l是亮度luminance，c是对比度contrast，s是结构structure。

循环神经网络RNN对时间建模：驾驶行为本质上需要对历史一段时间的输入作出判断，显然需要综合考虑当前时刻和过往时刻的输入及状态。如下图所示，a中若只考虑单一时刻的输入，则输出会非常的不连续且容易产生错误；下图b考虑了时间序列的输入，输出的概率密度更加稳定；在神经网络中，往往采用循环神经网络RNN的结构（下图c）对时间序列进行建模。

图源[1]

02 方法解读

现在的自动驾驶系统，通常来说可以分为感知、决策、规划、控制这几大层次，其中各个层次下又可以继续划分出多个子模块。虽然随着深度学习的成功，在感知层面使用深度学习算法已经是自动驾驶的“标配”了，但在诸如决策规划控制这些层面，完全使用深度学习算法仍有挑战。

一个主要的挑战在于：由于缺乏可解释性，深度学习在很大程度上仍被当成一个“黑盒”来使用，这会给车辆的控制带来一些安全性的考量。

尽管如此，仍有许多研究在试图使用神经网络完成感知、决策、规划、控制的“大一统”，即所谓的“端到端”（End-to-end）模型。

论文中解决的问题，也是一个“端到端”的问题：只用一个神经网络模型，输入是摄像头的图像数据，输出是对车辆的控制量（注：论文中的神经网络并非直接输出方向盘转角，因为方向盘转角与道路、天气、车辆动力学等有关，而是神经网络输出车辆的过弯曲率，再通过因车而异的公式换算为方向盘转角，实现车辆的控制），完成车道保持的任务（下图输入是图像，经过一个神经网络，控制车辆完成车道保持任务）。

图源[1]

数据和测试：

为了训练并对比多种不同的神经网络结构，研究者们在波士顿市区采集了5小时的人类驾驶数据，覆盖了多种天气和道路情况。这部分数据划分为训练集和测试集，用于在“被动测试”中对比不同结构的模型的训练和测试表现。“被动测试”中不同方法的训练和测试误差参见下表：

图源[1]

同时，作为“主动测试”，在测试场地上采集94分钟驾驶数据，并划分训练集和验证集，训练各类模型至验证集误差最小，选择模型进行实车测试场地“跑圈”测试（测试路线如下图），衡量不同模型在测试中的碰撞次数（即偏离车道次数）。

图源[1]

由此可以在“主动测试”的实车场景中，对比几个模型在不同程度噪声输入下（方差0-0.3范围内的高斯随机噪声）的碰撞次数：其中本文的NCP方法在噪声干扰下表现最为稳定。

图源[1]

神经网络的设计：

整个端到端神经网络如下图所示，包括了处理图像输入的卷积网络、接在卷积网络后将图像特征映射到控制空间的NCP网络。在NCP网络中，包括32个感官神经元（承接卷积网络的图像特征），12个中间神经元，6个指令神经元（类似RNN，具备循环连接的结构，即指令神经元之间可以彼此连接）和1个动作神经元（最终输出）。

图源[1]

在论文的摘要中，作者强调：“a single algorithm with 19 control neurons, connecting 32 encapsulated input features to outputs by 253 synapses, learns to map high-dimensional inputs into steering commands. ”设计一个算法有19个控制神经元（12+6+1=19），通过253个突触连接，映射32个感官神经元的输入特征到最终控制输出。

这一被称为NCP（Neural circuit policy）的网络结构，具备如下特点：

1. 和线虫相同的连接方式：包括感官、中间、指令、动作这4层次的网络拓扑结构，拥有高的计算效率（只需要少量神经元便能达到好的效果）。

2. 基础单元为LTC（Liquid time constant）神经元，其本质上是一个常微分方程，是具有非线性时变特性的神经元，有利于对时间序列建模：仿照线虫，对神经元的数学建模如下：

这一表达式是一个连续的常微分方程，论文中在求解时需要通过欧拉公式进行离散化求解，只要给定初始条件x(0)，便可以根据下式一步步求解t时间点的结果：

更详细的建模和训练过程可以参考[6]和[7]。

3. 简单高效：对比几个网络结构的参数量，同样的对时间序列输入建模，NCP相比于RNN和LSTM的方法要有更小的参数量，却有更好的效果。

图源[1]

4. 鲁棒：在不同方差大小的输入噪声下，NCP都有着最高的SSIM分数，表明了——NCP方法的显著性图，最不容易受到噪声的干扰，即模型能较稳定的关注道路上的关键信息。

图源[1]

5. 较强的可解释性：下图对卷积层的特征进行显著性图分析，发现在驾驶过程中，NCP方法训练出的模型能够稳定的关注道路信息（下图最右e列）。

图源[1]

对NCP神经元进行主成分分析PCA，发现PC1（即第一主成分）非常准确的学习了驾驶特征（左转、右转、直行）。相比论文中其他对比方法，NCP方法能够非常显著的将所学习到的特征与驾驶行为进行关联。下图中的PC1对左转、右转、直行都有非常不同的取值，证明模型能够有效的辨识不同路段下的控制行为。

图源[1]

最后，由于NCP的简单性，其拥有的神经元数量少，使得可以对单个神经元进行分析（下图），不需要像如今深度学习方法一样当作一个复杂的黑盒。这对于识别模型错误、提升模型安全性有帮助。

图源[1]

03 总结讨论

1. 虽然论文强调控制部分（包括中间层、指令层、动作层的神经元）仅需要使用19个神经元便能完成车道保持任务，但要看到的是——19个神经元的上游是一个多层的卷积神经网络CNN，依赖于有着众多神经元的CNN进行了图像特征的提取；

2. 并且，由于NCP和CNN是合并为一个神经网络进行端到端联合训练的，CNN除了进行图像特征提取外，由于其参数众多，可能也吸收了一部分对规划控制的学习。而文中的表述认为NCP用19个神经元单独承担了规划控制，我个人认为可能不完全准确；

3. 很明显，由于NCP的简单性，带来了鲁棒、可解释这两个优点。但论文中的测试道路只是无其他交通参与者的空旷道路，LTC这一神经元的设计以及NCP的算法能否完成更复杂的任务，并且在更复杂任务上也超越现有神经网络的表现，我个人是存疑的。并且为了解决复杂问题，不可避免会增加NCP的复杂性，而这一复杂性是否会让NCP丧失鲁棒、可解释性这两个优点，同样也是存疑的；

4. 尽管如此，这篇文章还是让我们看到了从生物学神经元启发，到完成数学建模，并最终应用于实际场景的巨大潜力。克服当前深度学习的明显问题和缺陷的方法，应当还在生物学中。

参考资料：

[1]Lechner, M., Hasani, R., Amini, A. et al. Neural circuit policies enabling auditable autonomy. Nat Mach Intell 2, 642–652 (2020). https://doi.org/10.1038/s42256-020-00237-3

[2] https://openaccess.engineering.oregonstate.edu/home

[3] https://www.nature.com/articles/d41586-019-02006-8

[4] https://blog.csdn.net/program_developer/article/details/80632779

[5] Simonyan, K. et al. “Deep Inside Convolutional Networks: Visualising Image Classification Models and Saliency Maps.” CoRR abs/1312.6034 (2014): n. pag.

[6] Wicks, Stephen R. , C. J. Roehrig , and C. H. Rankin . "A Dynamic Network Simulation of the Nematode Tap Withdrawal Circuit: Predictions Concerning Synaptic Function Using Behavioral Criteria." The Journal of Neuroence, 16.12(1996).

[7] Hasani, Ramin M. et al. “Liquid Time-constant Networks.” ArXiv abs/2006.04439 (2020): n. pag.

- END -

新朋友们可以看看我过往的相关文章

⬇

【相关推荐阅读】

深度学习在计算机视觉中应用的三大问题

David Marr和他的三层次Vision

Vision：从具象到抽象

AI随想（六）：算法工程师的Software 2.0（软件2.0）

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 225,928评论 6赞 523
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 97,032评论 3赞 410
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 173,382评论 0赞 370
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 61,580评论 1赞 304
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 70,558评论 6赞 403
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 54,018评论 1赞 316
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 42,261评论 3赞 432
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 41,328评论 0赞 281
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 47,858评论 1赞 328
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 39,843评论 3赞 351
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 41,954评论 1赞 358
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 37,565评论 5赞 352
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 43,251评论 3赞 342
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 33,677评论 0赞 25
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 34,834评论 1赞 278
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 50,558评论 3赞 383
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 47,033评论 2赞 368

NCP：19个神经元完成自动驾驶？

01 背景知识

02 方法解读

03 总结讨论

推荐阅读更多精彩内容