计算机视觉——经典语义分割模型(一)

姓名:雷含笑;学号:21021210745;学院:电子工程学院

【嵌牛导读】图像的语义分割是计算机视觉中重要的基本问题之一,其目标是对图像的每个像素点进行分类,将图像分割为若干个视觉上有意义的或感兴趣的区域,以利于后续的图像分析和视觉理解。近年来,深度卷积神经网络的出现,极大地推动了语义分割的发展。编解码结构是语义分割领域最为经典的网络结构,在解码器中使用多级特征融合的策略可以提升分割精度,该课题针对基于编解码器结构的语义分割网络,实现在语义分割相关任务上的训练和测试。

【嵌牛鼻子】语义分割 计算机视觉

【嵌牛提问】语义分割的源头和发展背景是什么样的?它可以用来做什么

【嵌牛正文】

从宏观上看,语义分割是一项高层次的任务,为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题,其意义在于越来越多的应用程序通过从图像中推断知识来提供营养。图像语义分割后的结果是将不同的物体分别用不同的颜色覆盖,以此来表示不同的语义类别。因为能够对图像中的场景进行语义理解和分割,图像语义分割的应用场景也越来越广泛,如无人驾驶技术,无人杋技术和智能机器人等[2]。这些智能设备通过图像语义分割算法对获取的实时图像进行处理,理解图像内容,然后做出反应。因此,图像语义分割算法的准确性对整个智能系统的运作至关重要。其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等。


图1 模拟自动驾驶

早期,计算机视觉的初始应用需求只是识别基本元素,例如边缘(线和曲线)或渐变。然而,仅仅通过全像素语义分割的创造来理解像素级的图像,它将属于同一目标的图像部分聚集在一起,从而扩展了语义分割的应用场景。识别每个像素或分组像素一起分配类别的过程可以通过以下过程:

·图像分类(image classification)——识别图像中存在的内容;

·物体识别和检测(object recognition and detection)——识别图像中存在的内容和位置(通过边界框);

·语义分割(semantic segmentation)——识别图像中存在的内容以及位置(通过查找属于它的所有像素)

近年来,信息处理技术和计算机计算能力迅猛发展,以图像为代表的数字信息呈指数级增长,与图像相关的应用也越来越广泛,随着人工智能和视觉设备的普及,如何让智能机器能够准确识别图像中丰富的视觉信息和语义信息已经成为一个及其重要且富有挑战的任务。计算机视觉技术适用于对图像进行标签、分类和分割等处理,能够使用电子设备代替生物眼球对物体进行识别、检测和定位等活动,支撑着现代社会机器生产力的提高以及人工智能的普及,是解决上述问题的一种重要技术。语义分割作为机器视觉领域三大基本住务之一,其目的是为图片中的每一个像素分配一个指定的语义标签,其本质是一个像素级别的多级分类问题。同时,语义分割也是图像分割的一种延伸,传统的图像分割方法包括:基于临界值的图像分割方法、基于边缘检测的图像分割方法、基于区域的图像分割方法和基于图理论的图像分割方法。但是,传统的图像分割方法难以满足图像理解的现实需要,无法使机器设备能够像人一样分析、理解图像中所包含物体的含义。

究其根本,传统的图像分割在原理上是利用了原图的色彩和纹理作为基准。因为这基本只涉及到图像中的低级特征,并非按照图像中物体的含义,因此分割出的结果就没有特殊的语义,也无法协助智能设备进行有效的工作。基于深度学习的语义分割算法恰恰填补了这一方面的空缺,对智能设备的工作达到辅助的作用。语义分割可以促进实现场景的完整理解,并为后续的图像处理任务奠定基础。对场景或情形的完整理解在计算机视觉领域是一个至关重要的问题。

图像的语义分割可以完成对图像中场景的理解,因此其应用空间也变得更加广泛,如智能安防、无人驾驶技术、人机交互、虚拟现实等最新应用。智能设备可以通过图像的语义分割算法对获取的实时图像进行处理,从而理解图像内容,然后做出下一步的反应。因此,图像的语义分割算法对众多智能系统的运作非常重要。它能使设备从图像中获取有效的信息,从而利用信息。基于深度学习的语义分割网络对图像进行处理后通常得到与原图像大小一致的结果,且在输出图像中对属于不同类别的像素点使用不同颜色进行覆盖,这样智能设备就可以进行下一步的场景理解和分析,从而指导其他设备进行后续操作。

经过多年发展,图像语义分割技术不断提高,其处理范围已经拓展到点云、三维图像和视频等数据,并且在工业自动化、智能汽车、虚拟现实、机器视觉、人机交互、视频监控和星际探索等不同行业都有广泛的应用,为人们的日常生活提供各种各样的便利。近几年,国内外众多研究组织都开展了语义分割问题的科研工作。香港中文大学多媒体实验室、南开大学媒体计算实验室、上海交通大学计算机视觉实验室、美国麻省理工学院机器视觉实验室、微软亚洲研究院视觉计算组、 Facebook人工智能实验室等科研机构相继展开针对该领域的学术研究。中国人工智能大会、全国模式识别学术会议等,每次召开都会对该领域做重点讨论。尤其是计算机视觉三大国际会议,近年来对该领域相关研究成果进行了详细报道和总结。这些组织和单位有效地推动了语义分割技术的发展。

如下所示,展示了自2014年以来流行的语义分割工作以及实例分割的时间表。图片出自2020年新出的一篇语义分割综述《mageSegmentation Using Deep Learning. A Survey》,图中橘色部分代表着语义分割的网络,绿色部分代表了实例分割的网络。


图2 语义分割发展年表

本系列第一篇的全部内容结束了,下面的几篇将继续展开介绍几个经典的语义分割模型。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容