目录
- 谱特征
- 最后
本文详细列举一些谱特征的公式定义,做业务的时候,再也不用为脑海里捉襟见肘的特征发愁了!!!
关于谱特征,其广泛的使用于机器学习和深度学习中,在乐器分类,音色分析,端点侦测,情绪识别,语音活动检测等等各种业务中都有大量的实践应用。
这些谱特征都是频域数据各个维度高度抽象、总结、量化的结果,为业务后续研发提供思维的燃料,脑海里有没有很重要,至于烧不烧、怎么烧是另外一回事,但前提是先备好这些"燃料",幸运的是,audioFlux项目提供下面所列谱特征几乎所有的支持,感兴趣的小伙伴后续可以用其做不同的测试以加深理解。
谱特征
为频带bin边界,
单位Hz,
为频谱值,可以 magnitud spectrum或power spectrum
1. Spectral Centroid
2. Spectral Spread
3. Spectral Skewness
4. Spectral Kurtosis
5. Spectral Entropy
设
或
6. Spectral Flatness
7. Spectral Crest
8. Spectral Flux
一般情况下
参与计算
9. Spectral Slope
平均频率值,
平均频谱值
10. Spectral Decrease
11. Spectral Rolloff
,一般取0.95或0.85,满足条件
获得
滚降频率
12. Spectral bandwidth
13. Spectral Energy相关
,
,表示数据的
压缩
14. Spectral Novelty相关
,满足
计算,
,结果不再
,满足
计算,
设为t时刻k点的相位函数
,
为
平均值
,满足
时参与求和计算
15. Novelty Method 相关
,满足
,
![]()
, 满足
时计算,一般
或
,满足
时个数统计,一般
使用
![]()
最后
以上谱特征只是频域数据常用的部分特征,可以在此基础上实现更为高级的音色听觉特征如roughness,hardness,brightness等等各种***ness音色感知特征。
14和15包含丰富多样的各种维度的Novelty相关方法,干货满满,每一个单独拎出来都可以作为一篇论文发表,建议使用audioFlux做详细的测试,一定会有不少的收获。
下面是一张使用audioFlux测试的部分特征效果图。
bi8.png