近期有幸在明神的推荐下,参加了成都Dell EMC的黑客马拉松比赛,连续奋战38小时,最终拿下了亚军,结果还是挺开心的。这里呢对这次比赛进行总结,因为此次比赛用到的技术很多,涉及面广,整个完成了一套AI分析系统。
首先介绍一下赛题的背景,熟悉英语的同学可以去这个链接 去看一下。我在这里简要介绍一下这次题目的背景,其假设我们向火星上发送了一个太空车,该车有自己的生命值和能量,随着宇宙环境(温度,辐射)的变化,该车的生命和能量也会发生相应的变化。此时太空车有一个保护罩,如果打开保护罩,就可以保护生命值不掉血,但是能量值会下降。如果关闭保护罩,生命值会减少,能量值会增加。生命值和能量值在开伞和关伞情况下的消耗,如下所示:
radiationRatio = (currentRadiation - minRadiation) / (maxRadiation - minRadiation)
temperatureRatio = (currentTemperature - minTemperature) / (maxTemperature - minTemperature)
if shield is ON:
energyLoss = radiationRatio * 5
team.energy = team.energy - ceil(energyLoss)
else:
lifeLoss = radiationRatio * 5
team.life = team.life - ceil(lifeLoss)
energyGain = temperatureRatio * 5
team.energy = team.energy + ceil(energyGain)
在实际操作中,比赛官方给了一个树莓派作为太空车的模拟设备,利用官方提供的实时数据源,自己编写客户端服务器程序进行信息收发,当然此时需要实时的网络通信协议(WebSocket)的支持。然后将树莓派接收的信息向云主机进行发送,在云主机上对接收到的数据进行实时备份,分析,可视化展示,对最终是否打开或者关闭保护罩进行决策。整体的流程图如下所示:
这次比赛,考察的技术非常全面,主要是完成整套的AI分析系统。在数据传输中需要Http协议,Websocket协议的支持;数据备份中,我们利用Hadoop来进行实时备份;日志存储,我们利用mongdb来进行存储;数据可视化,利用echarts, bootstrap来进行实时数据可视化。分析模块,主要是分析数据,具体思路也主要是强调去推测温度,辐射数据的变化趋势,争取利用最少的生命去换取最多的能量,这样去使得整个的生存时间最长。
当然通过上面的描述,我们可以看到整个系统的核心是对决策的支持,其余功能分别组成整个AI分析系统的其他部分。整体的技术构成比较庞杂,在本篇博客中先写对决策部分的分析。其后的几篇博客会分别对各项技术进行总结。
通过耘神的思考和我们的讨论,对整体的思路总结如下。整个的生命和能量的转换过程中,二者是一个动态变化的过程。而且在开伞和关伞的过程中,由于时间的变化,环境中的能量和温度的变化情况都不相同,我们需要把问题抽象成,要求整体中利用最少的生命去换取最多的能量,拿耘神的话,就叫血能转化率,也就是T/R,T是温度,R是辐射强度。如果这个值越大,我们应当选择关闭保护罩,这个值越小应该打开保护罩。当然当能量大于某一个阈值的时候,我们可以打开保护罩,让生命进行维持,依次递减到生命消耗光为止。因为在关伞时,能量的损耗和辐射有很大的关系,开伞时,能量的增加和温度有关,生命的损耗跟辐射有关。所以如果我们能够预判出整个温度和辐射的变化关系,我们就可以预判是应该打开或者关闭保护罩。我们通过对实时数据的可视化发现,其数据确实呈周期性变化,但不是特别标准,所以在实现的时候,我们利用数组多存储了5-6个历史值,算他们几个的梯度变化,最终分析曲线的走势,来做出合适的判断。
最后比赛结束后,我们和比赛官方的交流中,他们说题目中,温度和辐射的变化有一定的变化规律,是成周期性变化的,上升和下降都有一定的趋势。因此也是在这上面算是和出题者思路想复合吧,达到了比较不错的效果。当然我们也利用了一些深度学习和机器学习的手段去处理,最终由于实时性和准确性的考虑,放弃了那些做法。最终取得第二名还是比较开心的。