这两天想的方向

没有仔细精读论文，有些想法可能未必正确，周末把内容精细化并扩充

point-capsule for point cloud recognition
目前已经有3D capsule和pointnet/pointnet++了，看看能否把capsule改造成快速高效应对point cloud data的改进模型

整理3D deep learning / capsule / graphical CNN (deep graphical network) / deep fisher net论文集并认真阅读
先从读pointnet入手？先做一个general survey

de-capsule 模仿FCNN中反卷积deconvolution的模式，构建capsule的反向模式，实现capsule-type end-to-end (不知道这个可行否)
学习self-attention机制的论文，构建 (1) Self-attention 3d capnet,(2) Self-attention point net
结合transfer learning/semi-supervised learning构建co-attention CNN/capsule
capsule是否能引入latent variable用以增强对几何关系的描述能力？思路就是：latent capsule networks - bridging statistical and information theory for structure relationship representation ?/ relational capsule network / check relation CNN

张钹、朱军团队最新论文：深度隐式模型 + 概率图模型 = Graphical-GAN
https://www.leiphone.com/news/201804/4ed0ZWDrWP1XN6hw.html

CVPR2018中GAN特别火，能否提出Adversarial deep density clustering???

attention clustering ->扩展到science中的density clustering中？for video segmentation?

GAN in MRF ？ bridging statistical model and deep NN

CNN in MRF: Video Object Segmentation via Inference in A CNN-Based Higher-Order Spatio-Temporal MRF

本文由 AI Lab 独立完成。本文讨论了视频对象分割的问题，其中输入视频的第一帧初始对象的掩膜是给定的。作者提出了一个新的时空马尔可夫随机场（MRF）模型来解决问题。与传统的 MRF 模型不同，作者提出的模型中像素之间的空间相关性由卷积神经网络（CNN）编码。具体而言，对于给定的对象，可以通过用该对象预先训练的CNN来预测一组空间相邻像素进行分割标记的概率。因此，集合中像素之间的更高阶更丰富的依赖关系可以由 CNN 隐式建模。然后通过光流建立时间依赖关系，所得到的MRF模型结合了用于解决视频对象分割的空间和时间线索。然而，由于其中非常高阶的依赖关系，在MRF模型中执行推理非常困难。为此，作者提出了一种新颖的嵌入 CNN 的近似算法来有效地执行MRF模型中的推理。该算法通过迭代交替执行两个步骤：时间融合步骤和前馈CNN步骤。通过使用一种简单的基于外观的分割CNN进行初始化，作者提出的模型性能超过了DAVIS 2017挑战赛的获奖方法，而无需借助模型集成或任何专用检测器。

interactive/interaction 是一个大类，交互式，参考active learning

interactive deep clustering (先check interactive clustering)

这两天想的方向

推荐阅读更多精彩内容