今晚在Udacity上学习了Georgia Tech的《计算机视觉概论》的第一章和第二章的一小部分。很有意思,原来一张图片,我们都可以把它看成一个在二维区域上的函数。以前我总是他们理解为一个二维矩阵,虽然实际上没有错,只是单纯理解成矩阵有时候会限制对图像处理的进一步思考。
什么是计算机视觉?
我的理解是,通过对图像或视频的处理,从中识别出有用的信息,换句话说,就是要让计算机去理解图像的含义。它不同于图像处理,图像处理只是对图像的进一步加工。它也区别于计算机图形学,后者是通过一些数据去生成图像。要考虑这几个的区别,知乎上的一个回答很好,引用过来:
这幅图基本就说明了这几个概念的关系。