按学习方式分类
-
监督学习(Supervised Learning)
常用于分类问题和回归问题
-
无监督学习(Unsupervised Learning)
常用于关联、聚类、密度估计(density estimatiion)以及异常检测
-
半监督学习(Semi-Supervised Learning)
一般是监督学习算法的延伸,也常用于分类问题和回归问题。主要有五类:
- 基于概率的算法
- 在现有监督算法基础作假设的方法
- 直接依赖于聚类假设的方法
- 基于多视图的方法
- 基于图的方法
-
增强学习(Reinforcement Learning)
通常知识是隐含的,无法直接表示什么是正确的。学习的方法是通过“惩罚”不好的结果,“奖励”好的结果来优化学习效果。常用的算法包括:Q-learning以及时间差学习(Temporal diffenrence learning)
根据学习协议(Protocol)分类
-
批量学习(Batch learning)
“填鸭式”,将所有的已知训练数据一次性批量输入给学习算法。
-
在线学习(online learning)
“循序渐进式”,通过序列化地接受数据,循序渐进地学习,逐渐提高性能。
应用:垃圾邮件, 增强学习
-
主动学习(active learning / learning by asking)
提问式。可以看做是机器有问问题的能力。
按照输入空间的数据类型分类
-
具体特性(Conctrete Feature)
输入
的每一维的特征都被人类进行的整理和分析,这种分析常常是与专业领域关联的。比如对硬币分类需要的特征是(大小,重量);对信用分级需要的特征是客户的基本信息。这些特征中以及蕴含了人的思考。
-
原始特征(Raw Feaatures)
需要人活着机器(深度学习,DL)进行转换,将原始特征转换为具体的特征
抽象特征(Abstract Feature)
抽象特征通常没有任何真实意义,更需要人为的进行特征转换、抽取和再组织。
安照输出空间分类
- 二值分类问题
- 多值分类问题
- 回归问题
- 结构学习问题/序列标记问题
安照应用类型
- 关联
- 回归
- 密度估计
- 分类
- 聚类
- 异常检测
- 预测
- 时间序列
- 智能优化
计算机视觉主要任务
-
物体检测
物体检测是视觉感知的第一步,也是计算机视觉的一个重要分支。物体检测的目标,就是用框去标出物体的位置,并给出物体的类别。
物体检测和图像分类不一样,检测侧重于物体的搜索,而且物体检测的目标必须要有固定的形状和轮廓。图像分类可以是任意的目标,这个目标可能是物体,也可能是一些属性或者场景。
-
物体识别(狭义)
计算机视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体,图像特征或运动状态。这一问题通常可以通过机器自动解决,但是到目前为止,还没有某个单一的方法能够广泛的对各种情况进行判定:在任意环境中识别任意物体。
现有技术能够也只能够很好地解决特定目标的识别,比如简单几何图形识别、人脸识别、印刷或手写文件识别,或者车辆识别。而且这些识别需要在特定的环境中,具有指定的光照,背景和目标姿态要求。
-
图像分类
一张图像中是否包含某种物体,对图像进行特征描述是物体分类的主要研究内容。一般说来,物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述,然后使用分类器判断是否存在某类物体。
图像分类问题就是给输入图像分配标签的任务,这是计算机视觉的核心问题之一。这个过程往往与机器学习和深度学习不可分割。
-
物体定位
如果说图像识别解决的是what,那么,物体定位解决的则是where的问题。利用计算视觉技术找到图像中某一目标物体在图像中的位置,即定位。
目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。
-
图像分割
在图像处理过程中,有时会需要对图像进行分割来提取有价值的用于后继处理的部分,例如筛选特征点,或者分割一或多幅图片中含有特定目标的部分等。
图像分割指的是将数字图像细分为多个图像子区域(像素的集合,也被称作超像素)的过程。图像分割的目的是简化或改变图像的表示形式,使得图像更容易理解和分析。更精确地说,图像分割是对图像中的每个像素加标签的一个过程,这一过程使得具有相同标签的像素具有某种共同视觉特性。
“图像语意分割”是一个像素级别的物体识别,即每个像素点都要判断它的类别。它和检测的区别是,物体检测是一个物体级别的,他只需要一个框,去框住物体的位置,而通常分割是比检测要更难的问题。
计算机视觉是通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别,而是包含了一系列的过程,并且最终是可以在人工系统中被理解和实现的。