2021-08-10 | 近期文献阅读笔记

论文1：Autonomous On-Demand Free Flight Operations in Urban Air Mobility using Monte Carlo Tree Search

摘要：

为保证VTOL飞机安全高效地自主飞行，设计了一种避免碰撞的计算指导算法
将这个问题建模为马尔可夫决策过程，使用蒙特卡罗树搜索的在线算法来解决
基于数值实验来测试算法性能，结果表明可以使飞机快速到达目的地，避免与其他飞机的冲突

前人研究：

避碰算法：基于规则、基于优化、遗传算法、力场技术 → 混合整数规划（对小网络较为合适，不适用于随机动态模型）→ 基于马尔可夫决策过程的方法（这些方法需要离散状态空间，可能会丢失信息）→ 在线蒙特卡罗树搜索算法（不需要对状态空间进行离散化，但对计算资源要求较高）

理论基础：

马尔可夫决策过程 MDP
蒙特卡洛树搜索算法 MCTS
用于解决顺序决策问题的在线启发式搜索算法，通过在决策空间中随机抽取样本，并根据结果构建搜索树来判断动作的值，以UCB for Tree(UCT)为例，计算过程如下：

选择selection：选择UCT值最大的子节点，UCT值计算公式中，第一项由总奖励除以被访问次数得到，第二项中C为常数，n为被探索
扩展node expansion：创建一个或者多个子节点
仿真simulation：在某一结点用随机策略进行游戏，又称playout或者rollout
反向传播back propagation：使用随机搜索的结果来更新整个结果树

问题定义：

问题假设：

所有飞机只能以固定的速度直线飞行，只有一架飞机使用MCTS算法飞向目的地
所有飞机在相同高度飞行
不考虑入侵飞机之间的碰撞

状态空间：包括所有飞机(1个本飞机，n个入侵飞机)各自的位置(x, y)和速度(v_x, v_y)，以及本飞机的航向角和目的地。所以一共是4×n+4×1+2=4n+7个数字，状态空间则有4n+7个维度

最终状态：发生碰撞（做出行动后，下一秒两飞机距离小于r_min）、冲出地图和达到目的地

动作空间：{左转2°，右转2°，直行}

奖励函数：包含两个目标，第一是短时间内将飞机引导到目的地，第二是避免被控制的飞机和其他飞机之间的碰撞。奖励函数设定为飞机无碰撞达到终点时R(s)=1，加上折扣系数小于1，可以保证较快达到终点

算法训练过程

参数设置：

仿真次数n
固定深度d（树结构到达该深度则停止，计算最终飞机位置与目的地的距离来确定结果好坏）

训练过程

随机生成根节点状态v_0，s_0，在规定时间内进行扩展，仿真和反向传播，最后选择UCT值最大的子节点，继续循环

论文2：Multi-Agent Autonomous On-Demand Free Flight Operations in Urban Air Mobility

摘要：

提出了一种多协作飞机集中计算指引算法，通过生成所有飞机的实时动作来引导所有飞机到达各自的目的地，同时避免了飞机之间潜在的冲突
将这个问题建模为马尔可夫决策过程，使用蒙特卡罗树搜索的在线算法来管理多架合作飞机
创建了空域模拟器来测试该算法性能，结果表明该算法可以帮助所有飞机到达目的地，而在飞行过程中冲突率仅为0.2%
相比于上一篇论文，本文的改进之处：上一篇论文只能控制一架飞机来避免与其他入侵者飞机的冲突，本文可以通过让当前在空域飞行的多架飞机相互通信，来帮助它们以合作的方式采取行动

前人研究：

集中式/分散式：由一个中央控制器(集中式)解决，还是每架飞机单独(分散式)解决
计划/反应：计划式提前生成可行路径，而反应式通常使用在线避碰系统来应对危险情况
合作/不合作:飞机之间或飞机与中央控制器之间是否存在在线通信。

集中式方法：中央控制器在飞行前为所有飞机单独设计整体轨迹，可以表述成最优控制问题，解决方法包括半定规划、非线性规划、混合整数线性规划、混合整数二次规划、序列凸规划、二阶锥规划、进化技术等。此外，visibility图和Voronoi图等路线图方法也可以处理飞机的路径规划问题。当状态空间变大或高维时，精确解的计算将变得不切实际，因此提出了基于样本的规划算法，如概率路线图、RRT、RRT等。这些集中式方法通常追求全局最优解。然而随着飞机数量的增加，这些方法的计算时间通常呈指数增长。此外，随着环境中的新信息的更新(例如，一架新飞机进入空域)，这些集中规划方法通常需要重新运行
分散式方法：所有的冲突由每架飞机单独解决，可以是合作的，也可以是非合作的。在agent数量方面具有更好的扩展性，也更健壮，因为它们不存在单点故障
在非通信模式下的避碰算法：蒙特卡罗树搜索→基于几何的方法 DAIDALUS (Detect and Avoid Alerting Logic for Unmanned Systems)

理论基础：

Multi-Agent Systems
多智能体系统是一组自主的、相互作用的实体，它们共享一个共同的环境，通过传感器进行感知，并在此基础上与执行器进行决策和行动
多智能体系统的两个难点

维数灾难
非平稳性（Nonstationarity）：最佳策略会随着其他飞机的变化而变化

问题定义：

单机视角下与上文相同，让所有的飞机一个接一个地进行决策
当一架飞机选择了行动后，它将把这个信息广播给所有其他飞机，然后飞机做出决定可以利用这个信息来选择更好的行动

代码地址点击这里
 Youtube视频点击这里

最后编辑于：2021.08.11 22:54:07

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,451评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,172评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,782评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,709评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,733评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,578评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,320评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,241评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,686评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,878评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,992评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,715评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,336评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,912评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,040评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,173评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,947评论 2赞 355

2021-08-10 | 近期文献阅读笔记

论文1：Autonomous On-Demand Free Flight Operations in Urban Air Mobility using Monte Carlo Tree Search

摘要：

前人研究：

理论基础：

问题定义：

算法训练过程

论文2：Multi-Agent Autonomous On-Demand Free Flight Operations in Urban Air Mobility

摘要：

前人研究：

理论基础：

问题定义：

推荐阅读更多精彩内容