《计算机视觉教程》笔记
编著:章毓晋(清华大学电子工程系)
出版社:人民邮电出版社
出版时间:2017.3
计算机视觉与许多学科都有着千丝万缕的联系,特别是与一些相关和相近的学科交融交叉。
一、图像工程
图像工程是一门内容非常丰富的学科,包括既有联系又有区别的三个层次:
-
图像处理
图像处理着重强调在图像之间进行的转换(图像入图像出)。
1)包括对图像进行各种加工调整以改善图像的视觉效果并有利于后续高层加工的进行;
2)或对图像进行压缩编码,在保证所需视觉感受的基础上减少所需存储空间或传输时间,满足给定传输通路的要求;
3)或给图像增加一些附加信息但又不影响原始图像的外貌等 -
图像分析
图像分析主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息从而建立对图像中目标的描述(图像入数据出)。
如果说图像处理是一个从图像到图像的过程,则图像分析是一个从图像到数据的过程。
这里数据可以是对目标特征测量的结果,或是基于测量的符号表示。
它们描述了图像中目标的特点和性质。 -
图像理解
图像理解的重点是在图像分析的基础上进一步研究图像中各目标的性质和它们之间的相互联系,并得出对整幅图像内容含义的理解以及对原来成像客观场景的解释,从而可以让人们做出判断,并指导和规划行动。
如果说图像分析主要是以观察者为中心研究客观世界(主要研究可观察到的事物),那么图像理解在一定程度上则是以客观世界为中心,并借助知识、经验等来把握和解释整个客观世界(包括没有直接观察到的事物)。
(基于图像处理和分析的)图像理解与计算机视觉有相同的目标,都是借助工程技术的手段,通过客观场景所获得的图像来实现对场景的认识和解释。
它们可以看作是专业和背景不同的人习惯使用的不同术语。
二、机器视觉或机器人视觉
机器视觉或机器人视觉与计算机视觉有着千丝万缕的联系,很多情况下都作为同义词使用。
具体地说,一般认为计算机视觉更侧重于场景分析和图像解释的理论和方法,而机器视觉则更关注通过视觉传感器获取环境的图像,构建具有视觉感知功能的系统以及实现检测和辨识物体的算法。
另一方面,机器人视觉更强调机器人的机器视觉,要让机器人具有视觉感知功能。
三、模式识别
模式是指有相似性但又不完全相同的客观事物或现象所构成的类别。
模式包含的范围很广,图像就是模式的一种。
- (图像)模式识别与图像分析则比较相似,它们有相同的输入,而不同的输出结果可以比较方便地进行转换。
- 识别是指从客观事实中自动建立符号描述或进行逻辑推理的数学和技术,因而人们定义模式识别为对客观世界中的物体和过程进行分类、描述的学科。
目前,对图像模式的识别主要集中在对图像中感兴趣内容(目标)进行分类、分析和描述,在此基础上还可以进一步实现计算机视觉的目标。
同时,计算机视觉的研究中也使用了很多模式识别的概念和方法,但视觉信息有其特殊性和复杂性,传统的模式识别(竞争学习模型)并不能把计算机视觉全部包括进去。
四、人工智能和机器学习
人类智能主要指人类理解世界、判断事物、学习环境、规划行为、推理思维、解决问题等的能力。
人工智能则指由人类用计算机模拟、执行或再生某些与人类智能有关的功能的能力和技术。
视觉功能是人类智能的一种体现,所以计算机视觉与人工智能密切相关。
计算机视觉的研究中使用了许多人工智能技术,反过来,计算机视觉也可看作是人工智能的一个重要应用领域,需要借助人工智能的理论研究成果和系统实现经验。
机器学习是人工智能的核心,它研究如何使计算机模拟或实现人类的学习行为,从而获取新的知识或技能,这是计算机视觉完成复杂视觉任务的基础。
五、计算机图形学
图形学原本指用图形、图表、绘图等形式表达数据信息的科学,而计算机图形学研究的就是如何利用计算机技术来产生这些形式,它与计算机视觉也有密切的关系。
一般人们将计算机图形学称为计算机视觉的反/逆(inverse)问题,因为视觉从2-D图像提取3-D信息,而图形学里使用3-D模型来生成2-D场景图像(更一般的是从非图像形式的数据描述来生成逼真的图像)。
需要注意的是,与计算机视觉中存在许多不确定性相比,计算机图形学处理的多是确定性问题,是通过数学途径可以解决的问题。
在许多实际应用中,人们更多关心的是图形生成的速度和精度,即在实时性和逼真度之间取得某种妥协。