作者:秋半仙,哼哼
童鞋们好,你们搓着小拳拳期待已久的秋半仙语音分享会又上线啦~
迄今为止我们已经花了三期的篇幅介绍了信号处理的五大不安因素。今天本半仙将继续带大家认识认识这五大刺头之四——噪音!
从语音产品de 角度来说,使用语音产品的人,我们称之为“说话人”或“目标人”,也称之为“声源”。声源所发出的声音,是我们所需要的音频,也是信号处理需要提取出来的音频。相对应的,除此之外的其它声音,都可以称之为“噪音”。信号处理的一个重要职责,就是“降噪”,或者叫“消噪”、“噪声抑制”等等。所以需要注意的是,这里所指的“噪音”很广泛。在信号处理眼里,所有“说话人”给出的指令以外的声音都是瞎叨叨,都会被打入“噪音”冷宫。
当然,不同的使用场景,噪音的种类也是不同的。以汽车语音产品为例:
1. 自噪音变化。 在前面空间大类中提到过的“回声”,在噪声中也有一个名字,叫“自噪声”。这个“自噪声”顾名思义就是自己发出的噪音,自噪音音量越大,对信号处理的影响就越大;
2. 天气变化。当遇到雨天等其他恶劣天气时外部环境本身就有噪音,同时雨水敲打车顶车窗也会产生声音,如果此时麦克风是放置在前排车顶的位置,那离噪声源就很近了,也就更容易受到雨声和周围环境噪音的影响;
3. 地点变化。在都市和田园中,噪音全然不同;
4. 车速变化。不同时速条件下,车内噪音也不尽相同;
5. 腔体变化。五座车有四个车窗和一个天窗,每个窗打开的程度不同,都会导致车内腔体变化;
6. 风噪变化。不同的车速和不同腔体变化组合在一起,风噪的程度也会丰富多样;
7. 车噪变化。不同的车型,不同的发动机,不同的轮胎,车噪胎噪等都不相同;
8. 路况变化。堵车时的噪声和路面畅通时的噪声不同。与此同时,在平坦的高速公路、凹凸的城市道路和崎岖的山间小路行驶时噪声也都不相同;
9. 空调变化。空调是车上的主要噪声源,空调的风量大小、风向位置等都会发出不同的噪音;
10. 人声变化。说话人以外的人和说话人同时说话聊天,或者车内其他设备播放人声音频等等,都会产生不同的噪音;
11. 其它变化。比如车辆震动产生的噪声,电流产生的噪声,人为拍巴掌敲桌子, 等等。
不同的产品,不同的使用场景,需要考虑的噪音是不同的。但是一般从“硬件”、“空间”和“腔体”三个角度去深度思考,都能够比较全面的把握住自己的场景。
秋半仙温馨提示:
童鞋们要注意,上面所描述的噪音种类,并非同一个时间段只有一种,而是可能有大量变化因素同时发生。比如场景:“大众途观+车速20公里/h+都市堵车(下班高峰徐家汇路段)+空调打开、风量4 +主驾车窗半开、副驾车窗全关、后排车窗全关、天窗关闭+雨天 + 音乐播放、音量60%+主驾说话人正常说话+副驾说话人同时说话”……
是的,噪音就是个让信号处理头疼的小婊砸,鉴定完毕!
那要对付这个小婊砸,我们产品同学能做些什么呢?别着急,本半仙都已经给各位童鞋整理好了,主要有以下几点:
1. 仔细认真反复地想清楚具体的使用场景,分析清楚具体可能的噪音种类;
2. 从中挑取几个具有代表性的场景,采集尽可能全面、尽可能丰富、尽可能高质量的噪音音频数据;(这里童鞋们要特别注意设备是否会被移动,设备的麦克风和扬声器的位置变化关系,设备和声源及噪声源的位置变化关系,腔体和空间是否会发生变化等等。)
语音的噪声环境是非常复杂的系统,所有的噪声类又有自己的变化因素,比如音量大小不同,风速大小不同,道路崎岖不同等等,如果排列组合全部穷举再去做音频采集,可能会是一个极其庞大的工程。产品同学需要思考清楚,有侧重有取舍(如果可能,最好有数据统计的报告来支撑自己的判断),将核心的使用场景进行详细定义和采集,其他场景则抽样采集,以减少工程的投入消耗,提高方案的可行性。
好了,今天的分享就这么多。感谢童鞋们捧场,下课前别忘了点赞打卡哦~
—THE END—