最近完成了全频带实时降噪,目前已准备在产品上了。
先大概说一下该降噪整体情况,稍后会详细讲述整个降噪方案的细节并上传demo。
降噪突出点:
- 全频带(48k)降噪;
- 支持实时;
- 对音乐进行全保留;
- 降噪前向推理不依赖任何第三方;
- 标准c/c++编写,支持跨平台
- 处理速度快,CPU消耗低
- 抑制生活中各类场景噪音;
数据:
训练数据550小时
模型:
主要采用CNN+LSTM结构,采用人声分离思想,最终求mask。
测试结果:
音频以10ms一帧
机型 | 解码速度(ms) | CPU消耗(%) | 占用内存(M) |
---|---|---|---|
iPhone7 | 0.6 | 11 | 0.1 |
iPhone12 | 0.1 | 7 | 0.1 |
有做同类需求的欢迎交流。