前言
针对不同的应用和场景选择的特征提取不相同,信号特征的提取往往都是用最简单有效的参数表示信号中的信息,这是根本目的。
针对不同的后端模型需要确定特征维度
在开始特征提取前,信号往往需要做一些预处理,如滤波、去均值,去异常等等。
特征提取有哪些方法:
1. 对时间域一维信号,特征有:均值,方差,均方根,峰 值因子,峭度系数、波形因子、裕度因子、脉冲因子。
2. 估计-分布参数一般服从某一类分布
3. 频域,特征频率,均方频率,重心频率,频率误差
4. 小波方法提取的系数,小波滤波后的特征频率等等
5. 信号熵,铺熵,排列熵,EMD熵,包络熵等
6. 谱峭度,快速谱峭度,小波谱峭度
7. 基于数学工具和降维的特征,如PCA,矩阵特征向量,矩阵的秩,特征根,SVD-奇异值、ICA等等;
8. 一些基于距离的度量、范数、马氏距离、分形参数,同胚流行等等;
9、任何能表征信号特征的自定义参数均可以,注意有意义有时是结合实际需求的。
时域特征
1. 过零率
2. 短时能量
3. 短时平均幅度差
频域特征提取
重心频率:可以描述信号在频谱中分量较大的信号成分的频率,反映信号功率谱的分布情况。换句话说,对于给定的频带范围,低于重心频率的频率范围内包含的能量是信号总能量的一半。
均方根频率: 均方频率的算术平方根,可以看做惯性半径
均方频率: 均方频率是信号频率平方的加权平均
以上三者都是描述功率谱主频带位置分布的。
频率标准差: 是以重心频率为中心的惯性半径,若重心附近的频谱幅值较大,则频率标准差较小;若重心附近的频谱较小,则频率标准差较大。表示功率谱能量分布的分散程度
频率方差:是频率标准差的平方,是衡量功率谱能量分散程度的另一个维度
有量纲特征值8个——最大值、最小值、峰峰值、均值、方差、标准差、均方值、均方根值(RMS)
无量纲特征值6个——峭度、偏度、波形因子、峰值因子、脉冲因子、裕度因子
频域特征值5个——重心频率、均方频率、均方根频率、频率方差、频率标准差
信息熵特征值3个——功率谱熵、奇异谱熵、能量熵
(其他相关特征若干——样本熵等熵特征值、后续还会补充其他常用、不常用的特征指标)