感知哈希算法-找出相似的图片

原理讲解

参考Neal Krawetz博士的文章, 实现这种功能的关键技术叫做"感知哈希算法"(Perceptual Hash Algorithm), 意思是为图片生成一个指纹(字符串格式), 两张图片的指纹越相似, 说明两张图片就越相似。
但关键是如何根据图片计算出指纹呢? 下面说明一下原理:

1、缩小图片尺寸

将图片缩小到8x8的尺寸,总共64个像素。 这一步的作用是去除各种图片尺寸和图片比例的差异,只保留结构、明暗等基本信息。


2012071213282834.png

2、转为灰度图片

将缩小后的图片,转为64级灰度图片。


2012071213321187.png

3、计算灰度平均值

计算图片中所有像素的灰度平均值

4、比较像素的灰度

将每个像素的灰度与平均值进行比较,如果大于或等于平均值记为1,小于平均值记为0。

5、计算哈希值

将上一步的比较结果,组合在一起,就构成了一个64位的二进制整数,这就是这张图片的指纹。

6、对比图片指纹

得到图片的指纹后,就可以对比不同的图片的指纹,计算出64位中有多少位是不一样的,如果不相同的数据位数不超过5,就说明两张图片很相似,如果大于10,说明它们是两张不同的图片。

代码实现

using System;
using System.IO;
using System.Drawing;
 
namespace SimilarPhoto
{
    class SimilarPhoto
    {
        Image SourceImg;
 
        public SimilarPhoto(string filePath)
        {
            SourceImg = Image.FromFile(filePath);
        }
 
        public SimilarPhoto(Stream stream)
        {
            SourceImg = Image.FromStream(stream);
        }
 
        public String GetHash()
        {
            Image image = ReduceSize();
            Byte[] grayValues = ReduceColor(image);
            Byte average = CalcAverage(grayValues);
            String reslut = ComputeBits(grayValues, average);
            return reslut;
        }
 
        // Step 1 : Reduce size to 8*8
        private Image ReduceSize(int width = 8, int height = 8)
        {
            Image image = SourceImg.GetThumbnailImage(width, height, () => { return false; }, IntPtr.Zero);
            return image;
        }
 
        // Step 2 : Reduce Color
        private Byte[] ReduceColor(Image image)
        {
            Bitmap bitMap = new Bitmap(image);
            Byte[] grayValues = new Byte[image.Width * image.Height];
 
            for(int x = 0; x<image.Width; x++)
                for (int y = 0; y < image.Height; y++)
                {
                    Color color = bitMap.GetPixel(x, y);
                    byte grayValue = (byte)((color.R * 30 + color.G * 59 + color.B * 11) / 100);
                    grayValues[x * image.Width + y] = grayValue;
                }
            return grayValues;
        }
 
        // Step 3 : Average the colors
        private Byte CalcAverage(byte[] values)
        {
            int sum = 0;
            for (int i = 0; i < values.Length; i++)
                sum += (int)values[i];
            return Convert.ToByte(sum / values.Length);
        }
 
        // Step 4 : Compute the bits
        private String ComputeBits(byte[] values, byte averageValue)
        {
            char[] result = new char[values.Length];
            for (int i = 0; i < values.Length; i++)
            {
                if (values[i] < averageValue)
                    result[i] = '0';
                else
                    result[i] = '1';
            }
            return new String(result);
        }
 
        // Compare hash
        public static Int32 CalcSimilarDegree(string a, string b)
        {
            if (a.Length != b.Length)
                throw new ArgumentException();
            int count = 0;
            for (int i = 0; i < a.Length; i++)
            {
                if (a[i] != b[i])
                    count++;
            }
            return count;
        }
    }
}
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容