1 CV领域里面两大研究方向:
1 Detection
2 Tracking
两大方向的核心(基础)技术:ML->machine learning
2 Training and Testing
machine learning的几个关键元素:
1 样本(训练的数据, 可以是公开的, 也可以是自己标注的)
2 特征提取算法(可以无限研究的所在)
3 训练算法(相对比较稳定, 成熟)
4 模型(训练好的东西, 可以直接用来检测)
误区
1 不一定训练用的数据越多就越好, 特征提取和算法也至关重要
2 ML是一个很高深的东西.
3 ML的应用(不仅限于CV)
1 AlphaGo
2 声音识别
3 天气预报
4 什么是模型
- (NSString *)getNameBy:(CGFloat)height weight:(CGFloat)weight age:(int)age gender:(BOOL)male salary:(int)salary {
if (height > 175 && salary < 10) {
if (age < 18) {
return @"huafeng";
} else {
return @"pengwei";
}
} else if (salary > 20 && height >170) {
if (male) {
return @"weiyan";
} else {
return @"lidan";
}
}
return @"kaihao";
}
上面的方法根据输入返回一个名字, 里面有一堆复杂的判断和逻辑, 但是对于调用者来说, 是不关心里面的具体逻辑的, 这个方法实现对于调用者来说就是黑盒, 可以理解为一个模型. 通过ML训练得到的模型要比这个方法复杂很多, 里面可能涉及概率统计的知识, 但对于使用者模型就是一个黑盒.
5 Vison 与 Core ML 的关系
Vision 是 Apple 在 WWDC 2017 推出的图像识别框架.
Core ML 是 Apple 在 WWDC 2017 推出的机器学习框架.
Vision可以认为是苹果对一些常用模型的封装, 比如人脸检测, 文字检测等.
5 开发者能做什么
使用Vision或者其它更加成熟稳定的模型做应用:
用训练好的K线模型预测股票走势
用训练好的人脸识别模型给他加个帽子, 表情
用训练好的文章推荐模型给用户推送喜欢的新闻或者文章