Clustering聚类




一张图片,由RGB三种通道表示,每个通道由8位表达,也就是2的3*8=2的24次方=1600万像素点(颜色),从1600万颜色找出K个点聚类。

图像占用空间的大小计算:

大小=分辨率*位深/8

分辨率=宽*高(如:1024*768,640*480)

位深:如24位,16位,8位

/8计算的是字节数。

例如:

一幅图像分辨率:1024*768,24位,则其大小计算如下:

大小=1024*768824/8=2359296byte=2304KB


k-mean缺陷:

1.最大的问题就是K的选值。

2.对噪声很敏感,所以使用k-medoids中心点来缓解对噪音的影响。

3.k-mean数据分类只有{0、1}属于硬分配。比如有时数据点位于中心边界线上;缺乏分配的不确定性概率度量(置信度)。

所以引出高斯混合模型(GMM)


高斯概率模型可以给出每一个点在属于哪一个类的概率。



总结:

k-mean;

     1. complexity O(t,k,n,d) t:迭代次数 ;k:聚类点 ; n:像素点 ;d:维度深度

        2. 优势: 简单 、快速

        3.缺点:基于欧式距离、k取值;k-mean呈圆形(对图形的簇可以得到刚精确的分类);初始化和噪声敏感、数据点硬分类,无概率值置信度

GMM:

        1. complexity O(t,k,n,d) t:迭代次数 ;k:聚类点 ; n:像素点 ;d:维度深度

        2.优点:可以知道每个点在每个类中的概率值;抗噪最噪声更加稳定;

        3.缺点:聚类数k取值不定;主要适用于凸簇,高斯分布呈椭圆形状(对椭圆的簇可以得到刚精确的分类);奇点问题(加判断可解决)

对于其他形状的簇可以使用谱聚类算法spectral clustering(耗时十几秒其他都在1秒左右)、基于密度的空间聚类DBSCAN;


spectral clustering谱聚类算法

谱聚类(spectral clustering)是广泛使用的聚类算法,谱聚类是基于图论的,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法原理做一个总结。

原理:根据点云数据建立相似矩阵,然后进行拉普拉斯矩阵变换,通过高斯核距离的全连接方式进行特征值分解降维(复杂度O(n³)),然后进行使用最常用的无向图切图NCut(NormalizedCut)算法(将不同类的点连接线进行切割的最小代价,通过所切到的两个点连接线权重之和最小),最后使用k-mean算法进行分类。

谱聚类算法的主要优点有:

1)谱聚类只需要数据之间的相似度矩阵,因此对于处理稀疏数据的聚类很有效。这点传统聚类算法比如K-Means很难做到

2)由于使用了降维,因此在处理高维数据聚类时的复杂度比传统聚类算法好。

3)k是自动发现的

谱聚类算法的主要缺点有:

1)如果最终聚类的维度非常高,则由于降维的幅度不够,谱聚类的运行速度和最后的聚类效果均不好。2) 聚类效果依赖于相似矩阵,不同的相似矩阵得到的最终聚类效果可能很不同。

2)complexity O(n的三次方):1.拉普拉斯矩阵O(n*n*n)2. t:迭代次数 ;k:聚类点 ; n:像素点 ;d:维度深度




©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357

推荐阅读更多精彩内容