2021-08-10 | 近期文献阅读笔记

论文1:Autonomous On-Demand Free Flight Operations in Urban Air Mobility using Monte Carlo Tree Search

摘要:
  • 为保证VTOL飞机安全高效地自主飞行,设计了一种避免碰撞的计算指导算法
  • 将这个问题建模为马尔可夫决策过程,使用蒙特卡罗树搜索的在线算法来解决
  • 基于数值实验来测试算法性能,结果表明可以使飞机快速到达目的地,避免与其他飞机的冲突
前人研究:

避碰算法:基于规则、基于优化、遗传算法、力场技术 → 混合整数规划(对小网络较为合适,不适用于随机动态模型)→ 基于马尔可夫决策过程的方法(这些方法需要离散状态空间,可能会丢失信息)→ 在线蒙特卡罗树搜索算法(不需要对状态空间进行离散化,但对计算资源要求较高)

理论基础:
  1. 马尔可夫决策过程 MDP


  2. 蒙特卡洛树搜索算法 MCTS
    用于解决顺序决策问题的在线启发式搜索算法,通过在决策空间中随机抽取样本,并根据结果构建搜索树来判断动作的值,以UCB for Tree(UCT)为例,计算过程如下:
  • 选择selection:选择UCT值最大的子节点,UCT值计算公式中,第一项由总奖励除以被访问次数得到,第二项中C为常数,n为被探索


  • 扩展node expansion:创建一个或者多个子节点
  • 仿真simulation:在某一结点用随机策略进行游戏,又称playout或者rollout
  • 反向传播back propagation:使用随机搜索的结果来更新整个结果树


问题定义:

问题假设:

  • 所有飞机只能以固定的速度直线飞行,只有一架飞机使用MCTS算法飞向目的地
  • 所有飞机在相同高度飞行
  • 不考虑入侵飞机之间的碰撞

状态空间:包括所有飞机(1个本飞机,n个入侵飞机)各自的位置(x, y)速度(v_x, v_y),以及本飞机的航向角和目的地。所以一共是4×n+4×1+2=4n+7个数字,状态空间则有4n+7个维度

最终状态:发生碰撞(做出行动后,下一秒两飞机距离小于r_min)、冲出地图和达到目的地

动作空间:{左转2°,右转2°,直行}

奖励函数:包含两个目标,第一是短时间内将飞机引导到目的地,第二是避免被控制的飞机和其他飞机之间的碰撞。奖励函数设定为飞机无碰撞达到终点时R(s)=1,加上折扣系数小于1,可以保证较快达到终点

算法训练过程

参数设置:

  • 仿真次数n
  • 固定深度d(树结构到达该深度则停止,计算最终飞机位置与目的地的距离来确定结果好坏)

训练过程

  • 随机生成根节点状态v_0,s_0,在规定时间内进行扩展,仿真和反向传播,最后选择UCT值最大的子节点,继续循环


论文2:Multi-Agent Autonomous On-Demand Free Flight Operations in Urban Air Mobility

摘要:
  • 提出了一种多协作飞机集中计算指引算法,通过生成所有飞机的实时动作来引导所有飞机到达各自的目的地,同时避免了飞机之间潜在的冲突
  • 将这个问题建模为马尔可夫决策过程,使用蒙特卡罗树搜索的在线算法来管理多架合作飞机
  • 创建了空域模拟器来测试该算法性能,结果表明该算法可以帮助所有飞机到达目的地,而在飞行过程中冲突率仅为0.2%
  • 相比于上一篇论文,本文的改进之处:上一篇论文只能控制一架飞机来避免与其他入侵者飞机的冲突,本文可以通过让当前在空域飞行的多架飞机相互通信,来帮助它们以合作的方式采取行动
前人研究:
  • 集中式/分散式:由一个中央控制器(集中式)解决,还是每架飞机单独(分散式)解决
  • 计划/反应:计划式提前生成可行路径,而反应式通常使用在线避碰系统来应对危险情况
  • 合作/不合作:飞机之间或飞机与中央控制器之间是否存在在线通信。

集中式方法:中央控制器在飞行前为所有飞机单独设计整体轨迹,可以表述成最优控制问题,解决方法包括半定规划、非线性规划、混合整数线性规划、混合整数二次规划、序列凸规划、二阶锥规划、进化技术等。此外,visibility图和Voronoi图等路线图方法也可以处理飞机的路径规划问题。当状态空间变大或高维时,精确解的计算将变得不切实际,因此提出了基于样本的规划算法,如概率路线图、RRT、RRT等。这些集中式方法通常追求全局最优解。然而随着飞机数量的增加,这些方法的计算时间通常呈指数增长。此外,随着环境中的新信息的更新(例如,一架新飞机进入空域),这些集中规划方法通常需要重新运行
分散式方法:所有的冲突由每架飞机单独解决,可以是合作的,也可以是非合作的。在agent数量方面具有更好的扩展性,也更健壮,因为它们不存在单点故障
在非通信模式下的避碰算法:蒙特卡罗树搜索→基于几何的方法 DAIDALUS (Detect and Avoid Alerting Logic for Unmanned Systems)

理论基础:

Multi-Agent Systems
多智能体系统是一组自主的、相互作用的实体,它们共享一个共同的环境,通过传感器进行感知,并在此基础上与执行器进行决策和行动
多智能体系统的两个难点

  • 维数灾难
  • 非平稳性(Nonstationarity):最佳策略会随着其他飞机的变化而变化
问题定义:

单机视角下与上文相同,让所有的飞机一个接一个地进行决策
当一架飞机选择了行动后,它将把这个信息广播给所有其他飞机,然后飞机做出决定可以利用这个信息来选择更好的行动

代码地址点击这里
Youtube视频点击这里

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355

推荐阅读更多精彩内容