距离度量

距离定义

Paste_Image.png

Paste_Image.png

Paste_Image.png

曼哈顿距离可以用来衡量一个十字路口开车到另外一个十字路口的距离;就像在曼哈顿开车一样,这也是曼哈顿距离的由来。


Paste_Image.png

Paste_Image.png

Paste_Image.png
Paste_Image.png

马氏距离:


Paste_Image.png
Paste_Image.png

马氏距离可以消除相关系的干扰,同时也消除了量纲的影响,量纲可以理解为一种线性变换。


Paste_Image.png

Paste_Image.png


夹角余弦通常用来衡量两个向量直接的相似性,值域为[-1,1]


Paste_Image.png

相似度和系数是两个互斥的量,此消彼长,所有可以用1-相似性来表示距离


Paste_Image.png
Paste_Image.png
Paste_Image.png

目前接触到的相关性基本可以理解为线性相关,这样相关系数高只能表示线性相关性高,而相关性低是独立性高,也就是正态性。


DTW 距离:

Paste_Image.png

信息熵

Paste_Image.png

总结

Paste_Image.png

补充知识点

1. 协方差矩阵

均值:描述的是样本集合的中间点
方差、标准差:描述的是样本集合的各个样本点到均值的平均距离,描述的是样本的离散程度。
协方差:度量两个随机变量相互关系,协方差定义如下:


Paste_Image.png

方差是一种特殊的协方差:

Paste_Image.png

协方差矩阵:是多个随机变量两两之间协方差的集合,形式如下:

Paste_Image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容