AI全频带实时降噪

最近完成了全频带实时降噪,目前已准备在产品上了。
先大概说一下该降噪整体情况,稍后会详细讲述整个降噪方案的细节并上传demo。

降噪突出点:

  • 全频带(48k)降噪;
  • 支持实时;
  • 对音乐进行全保留;
  • 降噪前向推理不依赖任何第三方;
  • 标准c/c++编写,支持跨平台
  • 处理速度快,CPU消耗低
  • 抑制生活中各类场景噪音;

数据:
训练数据550小时

模型:
主要采用CNN+LSTM结构,采用人声分离思想,最终求mask。

测试结果:
音频以10ms一帧

机型 解码速度(ms) CPU消耗(%) 占用内存(M)
iPhone7 0.6 11 0.1
iPhone12 0.1 7 0.1

有做同类需求的欢迎交流。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容