心理声学基础

声音虽然客观存在,但是人的主观听觉和客观实际存在差异化。心理声学研究的就是声音的主观感觉和物理量之间的关系,因为人耳听觉对声音的主观响应是评价音质好坏的唯一标准。对于复杂的声音,从主观可以用响度、音高和音色来描述。客观上,响度和音高与声波的振幅(幅度)有关,音色和频谱及包络有关,而音高与频谱的频率有关。

1. 声音强度

声波的幅度可以用声压或者声强来表示,而实际中常常使用级来表示,分贝则是常用的级的单位。采用级的主要原因有:

a. 声音震动的能量范围比较大,最大与最小值可以相差10多个数量级,表示起来比较麻烦且易出错。使用对数表示则要方便许多。

b. 人耳听觉增长规律非线性,主观上的响度感觉并不正比于强度而是接近于强度的对数成正比。

分贝(decibel)是量度两个相同单位之数量比例的单位,主要用于度量声音强度,常用dB表示。“分”(deci-)指十分之一,个位是“贝”(bel),但一般只采用分贝。

2. 声功率级、声强级和声压级

  • 声功率级

声功率级是声功率与基准声功率之比的以10为底的对数乘以10,以分贝计。基准声功率必须指明。其数字表示式为SWL=10lg(W/Wo),常用基准声功率Wo为10-12W。

  • 声强级

声强级指某一处的声强级,是指该处的声强与参考声强的比值常用对数的值再乘以10,度量它的单位为分贝,符号为dB。数学表达式为SIL=10log(I/I(ref)),参考声强I(ref)是10-12瓦/米2。

  • 声压级

声压级指在空气中参考声压p(ref)一般取为2*10E-5帕,这个数值是正常人耳对1千赫声音刚刚能觉察其存在的声压值,也就是1千赫声音的可听阈声压。数学表达式为:SPL=20lg(p/p(ref))

生活中所到的正常交谈约60dB噪音在80dB左右以上而安全极限为140dB,这里使用的就是声压级。

  • librosa.power_to_db

librosa中计算分贝,直接使用两个相同的物理量(例如A1和A0)之比取以10为底的对数并乘以10(也可以是20)。

@cache(level=30)
def power_to_db(S, ref=1.0, amin=1e-10, top_db=80.0):
    S = np.asarray(S)
    if amin <= 0:
        raise ParameterError('amin must be strictly positive')

    if np.issubdtype(S.dtype, np.complexfloating):
        warnings.warn('power_to_db was called on complex input so phase '
                      'information will be discarded. To suppress this warning, '
                      'call power_to_db(magphase(D, power=2)[0]) instead.')
        magnitude = np.abs(S)
    else:
        magnitude = S

    if six.callable(ref):
        # User supplied a function to calculate reference power
        ref_value = ref(magnitude)
    else:
        ref_value = np.abs(ref)

    log_spec = 10.0 * np.log10(np.maximum(amin, magnitude))
    log_spec -= 10.0 * np.log10(np.maximum(amin, ref_value))

    if top_db is not None:
        if top_db < 0:
            raise ParameterError('top_db must be non-negative')
        log_spec = np.maximum(log_spec, log_spec.max() - top_db)

    return log_spec

3. 听觉的频率响应、响度

级表明人耳对信号的强度呈非线性增长的特点,然而2个相同声级的声音人耳听起来也不一定相同,这是因为人耳的听觉频响是不平直的。

  • 等响曲线

从等响曲线图中我们发现,人耳对高频的声音更加敏感,同样声压级下的高频声音响度级比低频的高。一般女性发声的高频成分较多,而男性发声的低频成分相对较多,这就是在同样力气讲话时(声压级相同),女性的声音听上去更加响的原因。

  • 听觉频响

声压级越高,人的听觉频响越平直,随着声压级降低人的听觉频响月不平直,尤其在中低频下跌幅度越大。而无论声压级多大,低于20Hz和高于20kHz的声音一般听不到而对3-5kHz频率段最敏感。

  • 响度

响度级和等响曲线描述了人耳的听觉频响,但要描述人耳对声音大小强弱的主观判断需要引入响度。响度是一个无量纲单位。

4. 音高音阶

人耳对声音高低的感觉主要与频率有关,人耳的音高感觉大致与声音的基频对数呈线性关系,12平均律音阶就是在频率的对数上取等分得到的。

  • 倍程

倍频程是频程的单位,符号为oct,等于2个音的频率比取2位底的对数,在音乐中称之为八度。n=log2(f2/f1)

  • 12平均律

十二平均律,亦称“十二等程律”,世界上通用的一组音(八度)分成十二个半音音程的律制,各相邻两律之间的振动数之比完全相等。十二平均律是指八度的音程(一倍频程)按频率比例地分成十二等份,每一等份称为一个半音小二度。

一个大二度则是两等份。 将一个八度分成12等份有着惊人的一些凑巧。它的纯五度音程的两个音的频率比(即2 的7/12 次方)与1.5 非常接近,人耳基 本上听不出“五度相生律”和“十二平均律”的五度音程的差别。十二平均律在交响乐队和键盘乐器中得到广泛使用,现在的钢琴即是根据十二平均律来定音的。

  • 音调

心理声学中除了使用响度表达声音的强度,使用音调来表达听觉主观感受,音调单位为MEL。

  • 音色

音色(Timbre)是指不同声音表现在波形方面总是有与众不同的特性,不同的物体振动都有不同的特点。音色是声音的属性(即响度、音调、音色)之一,主要由其泛音决定。每个人的声音以及各种乐器所发出的声音的区别,就是由音色不同造成的。

不同的发声体由于其材料、结构不同,则发出声音的音色也不同。例如钢琴、小提琴和人发出的声音不一样,每一个人发出的声音也不一样。音色是声音的特点,和全世界人们的相貌一样总是与众不同。根据不同的音色,即使在同一音高和同一声音强度的情况下,我们也能区分出是不同乐器或人发出的。如同千变万化的调色盘是的颜色一样,“音色”也会千变万化而容易理解。

音色又称为音品。为什么音色不同?是由于不同的振动总是可组合成为不同的声音。每一种乐器、不同的人的声带,以及其它所有的能振动的物体都能够发出各有特色的不同的声音,这些声音的还可以有仪器显示出波形波形。声音除了有一个‘基音’外,还自然而然加上许多不同‘频率’(振动的物体1秒钟振动的次数)与泛音‘交织’,就决定了不同的音色,使人听了以后能辨别出是不同的声音。如同区分不同的‘身份证’一样。

一般来说,谐音越丰富音色越明亮也可能越尖锐,相反的,谐音贫乏的听起来更具有暗淡或柔和的音色。除了频谱,音色还与波的时间结构(包络)有关,包含起始、稳定到衰减的特性。

5. 心理效应

  • 双耳效应

声源发出的声波到双耳的距离不同引起双耳的强度差、时间差和相位差。一侧耳朵出现的遮蔽效应也会引起强度差和音色差等。

  • 哈斯效应

哈斯效应又称之为延时效应或优先效应,表征人耳对延时声的分辨能力,2个同样的声音先后到达,若其中一个快5-35ms那么人耳几乎察觉不到延迟,后一个起到丰满补充的作用;如果相差30-50ms人耳会有一定察觉但仍然取决于先到的声音方向;如果相差50ms以上,人耳就能分辨2个声音各自的来源方向。

  • 德波埃效应

作为立体声系统定向的基础之一,声强级差与时间差所引起的效是是类似的,其间可以相互补偿,并且声强级差在15dB以下、时间差在3ms以内时,它们之间呈线性关系,每5dB的声强级差引起的声像偏移相当于两声音引起的时间差1ms的效果,这便是德波埃效应。

  • 掩蔽效应

一个较弱的声音的听觉感受被另一个较强的声音影响的现象,我们就称之为人耳的“掩蔽效应”。“掩蔽效应”存在时域和频域掩蔽,“掩蔽效应”在实际声学应用中有很重要的作用,比如MP3压缩技术就采用了掩蔽效应。

  • 鸡尾酒效应

描述在嘈杂环境中,人耳可以在掩蔽声中选择有用的声音并专注于想听的内容,表征了人在听觉上的选择关注能力。


我们是行者AI,我们在“AI+游戏”中不断前行。

如果你也对游戏感兴趣,对AI充满好奇,就快来加入我们吧~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,193评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,306评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,130评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,110评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,118评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,085评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,007评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,844评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,283评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,508评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,395评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,985评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,630评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,797评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,653评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,553评论 2 352