【生物特征识别】模式识别方法

注:暑课听得云里雾里稀里哗啦,简单结合别人博客总结一下一些最基本的模式识别相关技术。为什么简书和Typora不是完美衔接的...好多乱码...摔。

Introduction of PR Approaches

  • 统计模式识别——找得到特征并进行描述

    • 特征提取

      • 线性特征提取
        • PCA
        • 2d PCA
        • LDA
      • 滤波
        • Fourier Transform
        • Garbor Filter
  • 句法模式识别——存在具有联系的各种结构

  • 神经网络模式识别——结构特征均复杂

    • ANN

ANN (Artificial Neural Networks)

  • Back Propagation

    1. 利用初始权量,在输入向量上运行前向传播,从而得到所有网络所有神经元的输出。
    2. 由此,每个输出层神经元得到一个误差,即输出值与实际值之差。
    3. 计算作为神经元权量的函数的误差的梯度,然后根据误差降低最快的方向调整权量。
    4. 将这些输出误差反向传播给隐藏层以便计算相应误差。
    5. 计算这些误差的梯度,并利用同样的方式调整隐藏层的权量。

    不断迭代,直到网络收敛。 实际上,度量一个神经网络好不好,也是主要看是否收敛和收敛的速度。

PCA (Principal Component Analysis)

  • 步骤 (对m条n维数据降到指定k维)
    1. 将原始数据按列组成一个$m*n$矩阵X;
    2. 将X的每一行(代表一个属性字段(feature))进行0均值化(减去均值);
    3. 求出协方差矩阵C,$C=\frac{1}{m}XX^\mathsf{T}$
    4. 求出C的特征值及对应的特征向量;
    5. 将特征向量按对应特征值大小从上到下按行排列成矩阵,取前k行组成矩阵P;
    6. Y=PX即为降维到k维后的数据;
  • 解释
    1. 设我们有m个n维数据记录,将其按列排成$m*n$的矩阵X,设$C=\frac{1}{m}XX^\mathsf{T}$,则C是一个对称矩阵,其对角线分别个各个字段的方差,而第i散布矩阵是用来估计多维正态分布协方差的统计量行j列和j行i列元素相同,表示i和j两个字段的协方差(协方差表示字段间的独立性,协方差为0时字段完全独立)。
    2. 第四步即对角化C,这是为了使各字段两两间协方差为0,而字段的方差则尽可能大。
    3. PCA相当于说把训练数据各个类之间相关度高的筛除。这是通过寻找合适的坐标轴表达实现的。
  • 分析
    1. PCA本质上是将方差最大的方向作为主要特征,并且在各个正交方向上将数据“离相关”,也就是让它们在不同正交方向上没有相关性。
    2. PCA也存在一些限制,例如它可以很好的解除线性相关,但是对于高阶相关性就没有办法了,对于存在高阶相关性的数据,可以考虑Kernel PCA,通过Kernel函数将非线性相关转为线性相关,关于这点就不展开讨论了。另外,PCA假设数据各主特征是分布在正交方向上,如果在非正交方向上存在几个方差较大的方向,PCA的效果就大打折扣了。
    3. 其主成分分析的训练是非监督的,无法利用训练样本的类别信息。且识别率不是很高,维数基本比较大,计算量大。

2D PCA

  • 优势
    1. 直接计算训练样本的协方差矩阵;
    2. 计算特征值与特征向量的用时更少(因为协方差矩阵更小);
  • 与PCA之对比
    1. 使用原始图像数据,协方差矩阵规模小,计算特征值和特征向量对应地更为简单。
    2. 保留了原始图像邻域之间的内在联系,使得准确度得以提高;

LDA (Linear Discrimination Analysis)

  • 步骤

    1. 计算散布矩阵$S_w$和类内散布矩阵$S_b$;
    2. 第二步,计算$S_w^{-1}S_b$的特征值及特征向量,从而实现LDA转换;
  • 解释

    ​ LDA主要是把训练数据投射到另一个空间上,使其同类间紧凑,不同类之间分得开。


    LDA示意图
  • 优势

    1. 对于区分度高的特征提取有良好效果;
    2. 可降维;
  • 限制

    1. LDA至多可生成C-1维子空间;
    2. LDA不适合对非高斯分布的样本进行降维;
    3. LDA在样本分类信息依赖方差而不是均值时,效果不好;
    4. LDA可能过度拟合数据。

2d Fourier Transform

op1=>operation: Spacial Domain f(x,y)
op2=>operation: Frequency Domain F(u,v)
op1->op2
  • 概述

    利用傅里叶变换,得到频谱图;频谱图选定范围进行傅里叶逆变换,得到原图像的相应处理图(保持灰度)。根据频谱图,可以提取图像特征。

Gabor Filter

  • 概述

    在图像处理中,Gabor函数是一个用于边缘提取的线性滤波器。Gabor滤波器的频率和方向表达同人类视觉系统类似。研究发现,Gabor滤波器十分适合纹理表达和分离。在空间域中,一个二维Gabor滤波器是一个由正弦平面波调制的高斯核函数。

    在实际应用时,可以根据检测对象的方向趋势,选择合适的方向参数进行滤波。如在检测人脸的五官时,可以根据人脸的偏转角度进行滤波,可以使特征点的定位更加准确。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,634评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,951评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,427评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,770评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,835评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,799评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,768评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,544评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,979评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,271评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,427评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,121评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,756评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,375评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,579评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,410评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,315评论 2 352

推荐阅读更多精彩内容