一、图像检索
图像检索两个框架:基于文本和基于内容
1.基于文本
常规的图像检索框架,图像由文本注释,然后通过文本在图像数据库中检索。
缺点:
人工注释需要相当大的人力开销
由于人类的主观性会导致文本的注释不准确为克服基于文本检索框架的缺点,在20世纪80年代引入了基于内容的图像检索。
2.基于内容
基于内容的图像检索(CBIR)系统,使得用户能够在系统中找到与查询图像类似的图像。
图像内容:例如颜色,纹理,形状等
二、项目介绍
本项目是采用keras深度学习框架,在MNIST数据集上实现基本的图像检索功能。
基于内容的图像检索的框架:
1.图像特征提取
基于内容的图像检索的关键是特征提取。
手工特征提取:
颜色直方图定义颜色
方向梯度直方图限定形状CNN特征提取:
使用为分类而训练的CNN来提取图像特征,如VGG16、ResNet等。
但这种方法仍然需要标记数据来训练神经网络,打标签的工作成本非常高。去噪自动编码器提取
无监督的深度学习方法
2.去噪自动编码器
去噪自动编码器是用于图像去噪的神经网络,它可以学习到图像上的重要特征,即提取图像的本质。
- 去噪自动编码器结构