-
机器学习是基础
入门最快的方式是学习最新的东西 - 一定要发文章
面试:做过什么;怎么做的;遇到过什么问题;怎么解决的 - 看文章最重要的就是知道我们可以做什么
做正确的事
看最好的东西
发最好的文章
https://www.ijcai.org/proceedings/2019/
增量学习(incremental learning)
能不断地从新样本中学习新的知识,并能保存大部分以前已经学习到的知识。
例如:大型数据库:Web日志记录
流数据:股票交易数据 类似于线上学习
https://www.jiqizhixin.com/graph/technologies/09134d6a-96cc-409b-86ef-18af25abf095
https://zhuanlan.zhihu.com/p/41422048
https://blog.csdn.net/Losteng/article/details/51058026
模仿学习(Imitation Learning)
行为克隆(Behavior Cloning:根据人类提供的状态动作对来习得策略,是作为监督学习的模仿学习。
逆强化学习(Inverse Reinforcement Learning ):因为缺乏显式reward,只能根据人类行为,进行 reward的估计。在得到 reward 函数估计后,再进行 策略函数的估计,即解释专家的行为。
结构化预测(Structured prediction):拟合的目标不是输出一个标量或者一个类别,而是输出些有结构的输出,比如,一个序列,一个句子,一个图,一颗树。
GAN:我们可以假设expert轨迹属于一个 distribution,我们想让我们的 model,也去 predict 一个分布出来,然后使得这两者之间尽可能的接近。Generator:产生出一个轨迹;Discriminator:判断给定的轨迹是否是 expert 做的
https://huangwang.github.io/2019/01/26/%E6%A8%A1%E4%BB%BF%E5%AD%A6%E4%B9%A0%E7%A0%94%E7%A9%B6%E7%AC%94%E8%AE%B0/
应用领域:自动驾驶
https://www.jiqizhixin.com/articles/2018-01-28-4
多任务学习(Multi-task Learning)
把多个相关(related)的任务(task)放在一起学习,多个任务之间共享一些因素,它们可以在学习过程中,共享它们所学到的信息。相关联的多任务学习比单任务学习能去的更好的泛化(generalization)效果。
是多标签学习,多分类学习的一种提升
https://zhuanlan.zhihu.com/p/27421983