任务:
预测未来帧的场景分割,给定视频帧的输入序列,预测未观察到的帧的场景图。
动机:
预测像素值与预测高层次的场景相比过于复杂,然而后者对于大多数应用都已经足够。例如轨迹。我们不对物体或者其他的场景元素建模,而是对物体类别的场景分割图动态性建模。
模型:
用之前的multi-scale network
多步预测
1、batch 预测:一次性输出所有的预测
2、autoregressive:循环预测
预测未来帧的场景分割,给定视频帧的输入序列,预测未观察到的帧的场景图。
预测像素值与预测高层次的场景相比过于复杂,然而后者对于大多数应用都已经足够。例如轨迹。我们不对物体或者其他的场景元素建模,而是对物体类别的场景分割图动态性建模。
用之前的multi-scale network
1、batch 预测:一次性输出所有的预测
2、autoregressive:循环预测