深度学习中的图片对象

自2012年,AlexNet在ImageNet图像识别一战成名后,基于深度学习的图像识别快速发展。

图像识别也是深度学习研究的主要领域。

本文解释在机器角度,图片的存在形式,这也是图片在深度学习的输入对象。

单通道图片


单通道图片/灰度图在计算机中以数字的形式存储,数值范围在0-255(0是暗色,255是亮色)

三通道图片


彩色图像通常由几个叠加的彩色通道构成。
例如,平时常见的图片一般都是RGB图片,即由红色、绿色、蓝色三个通道组成的图片,在表达每个像素点时用三个值表示,每个值取0~255。

可以把这三个值理解为各种颜色的深度,比如(0,255,0)就是绿色,是最深的那种绿色,比如(255,255,255)就是白色,因为红绿蓝组合一起就是白色

例如下图是一张198*280的RGB图片,对应到计算机上是三张数据表,每张表有198*280个数值。位置(i,j)的值为分别取三张表位置(i,j)的值组成

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。