这个标题有点怪异,前半句仿佛在总结和感慨,而后半句又很具体地讨论一个人工智能技术问题。之所以这么取,主要还是考虑到人工智能技术发展快,而技术在实验室的进展和在商业社会中的进展又不一样,即便某技术实现了,要传播开经验证也需要时间。因此要讨论一个AI技术实现问题,标注好时间段是最好的。
故而标题这么写。而恢复处理马赛克图片的AI技术就是2020年公开的恢复马赛克图片的先进技术(如果直言2020又可能被平台认为是旧闻而屏蔽)。当然,马赛克图不光是人像这类实拍图,还有文字马赛克。人像马赛克、文字马赛克两种,之前的文章里机智客就分别介绍过,这次再总结式地简单聊下AI处理马赛克图片的技术。主要是有网上的朋友这么问,所以就聊下。
所以文字马赛克就不多说了,想来这个大家也不咋感兴趣。更多人感兴趣的是实拍图片马赛克的恢复问题。我们就以去年那个PULSE技术来介绍一下马赛克图片恢复的技术和不足的问题。
这个项目的思路其实是这样的,AI通过大量实拍图片库来训练和做素材,把待处理的马赛克图调整到一个固定的尺寸,然后通过和图片库对比。当找到相似的图片时,AI会把马赛克图和图片做进一步的想象和合成,最终得到恢复后的图片。
也许你觉得这不就是找相似的图片偷梁换柱吗,当然并非如此,没那么简单,它是通过大量图片库的面部信息做训练,识别并还原过很多张人像的头发、眼睛、厨部等细节。它的重点其实是根本已有的训练数据,来学会一种想象能力,以此想象恢复马赛克的。
这个项目我是在Ubuntu20.04系统里试的。用anaconda新建虚拟环境,用Python3.8版本。进入虚拟环境。这个项目需要cmake,dlib等库,需要英伟达显卡。库的话一一安装就行了。Python里引用的第三方库用pip install 直接安装。环境弄完了,把马赛克图片弄到相应文件夹里。打马赛克图片有个小插曲。我们大家看到的马赛克图,可能很多都是用Photoshop处理的。而机智客这几年一直在用开源软件GIMP。自己发现用这个作图软件加的马赛克,和PS那种效果不一样。后来也有点错误,不知道是不是不同马赛克的问题。有了马赛克图片,在理论上我们在终端下用Python run.py命令就可以完成了。当然了,如果现实中有什么错误,看终端里的提示即可。比如第三方库没安装,就用pip安装即可。
虽然说这个AI技术很有噱头,不过看结果我们还是需要打消自己那个大胆的想法的。目前的人工智能技术,的确无法完美恢复马赛克图片——有时候恢复的还不错,有的就误差太大了。另外,这个是国外公布的技术,依赖的图片库里素材都是外国人。用在我们国人或亚洲人的马赛克图上就“水土不服”了。更重要的是,这个AI只训练了人脸部分,没训练别的部位。
很多现在的人工智能技术就是这样,都是一点一点的技术突破,公开出来也只是一个雏形,受制于软硬件等技术实施和普及度,还需要不断地进步。