当今的自主驾驶是典型的数据驱动的产业,八仙过海各显神通。无论技术多么先进,他们所有决策和算法都是来基于senor产生的数据。比如,以Udacity Lincoln MKZ为例,sensor产生的数据高达3GB/分钟。为了可以充分利用这些海量数据,建立一个高效可扩展的Data Pipeline就变得必不可少!【于是乎,一年前,某知名自主驾驶公司就挖走砖厂的某砖家去为他们做Data Pipeline】
这里给大家分享两个相关的slides。
- 微软Azure为自主驾驶的开发/测试提供了端到端的工作流方案,大大提升数据接入,处理,测试,训练,模拟仿真,构建和验证的工作效率。工作流的每个步骤都集成大量的生态系统常见的开发工具,Apache Spark为核心的Azure Databricks是这些工具集的典型代表,Azure让自动驾驶真正步入“Drive Millions, Train on Billions”时代。PPT: Microsoft Azure in Autonomous Driving
- Valtech director 分享的一种典型的自主驾驶的技术方案: Apache Spark/TensorFlow/RoS。PPT: Machine Learning for Self-Driving Cars