临界频带标尺

从许多受试对象那里收集到的数据得到了临界频带宽度的合理估计。对这一宽度在低频下的讨论证实,必须考虑传感器的频率响应,才能产生有意义的数据用于临界频带估计。在200Hz以下,使用从FM切换到AM时的相位效应可检测性的方法似乎是最可靠的方法。虽然声音频率区间的最低临界带宽可能非常接近80Hz,为那个临界频带添加听不到的频率范围从0Hz到20 Hz是有吸引力的,并假定最低临界频带范围从0Hz到100Hz。使用这个近似值,图6-8显示了我们使用五种方法,50多名受试者的平均数据,声音量级在静音阈值和大约90dB之间。尽管在70dB以上的量级上临界频带有小幅增加的趋势,但是图6-8中给出的曲线很好地近似了临界带宽作为频率的函数。频率到500Hz左右,临界带宽保持在100Hz左右。在500Hz之上,临界带宽的增加速度比频率增加速度慢一些,而在3kHz以上,临界带宽的增加速度比频率增加速度快一些。在中心频率500Hz以下,假设临界带宽恒定为100Hz,在中心频率500Hz以上时,假设相对带宽为中心频率的20%,这是有用的。表6-1给出了更准确的数值,给出了临界频带的下限值和上限值,如果一个临界频带的上截止频率与下一个临界频带的下截止频率相同,则临界频带的上限值和上限值可以累加。

表6-1临界频带率z,临界带宽ΔfG的下限(fl)和上限(fu),fc为中心频率

图6-8 临界带宽作为频率的函数。低频和高频范围的近似用虚线表示


临界频带概念对于描述听觉感知很重要。它在许多模型和假设中被使用,定义单位临界带宽为所谓的临界频带率。这个度量是基于这一事实,即我们的听觉系统将宽带频谱分析成与临界频带相关的部分。将一个临界频带与下一个临界频带相加,使上一个临界频带的上限与下一个更高临界频带的下限相等,形成临界频带率。如果以这种方式将临界频带相加,则每个交点都对应一个确定的频率(见表6-1)。这个过程如图6-9所示。第一个临界频带的范围是0~100Hz,第二个是100~200Hz,第三个是200~300 Hz,以此类推,一直到500Hz,当然,每个临界频带的频率范围都在增加。绘制每个临界频带的序数作为频率的函数,排列在图6-9中产生一系列的点。可以看出,在16kHz的音频范围内,可以细分为24个相邻的临界频带。这些系列的点并不意味着临界频带只存在于相邻的两个点之间;相反,它们应该被认为是能够沿着通过这些点的曲线产生的刻度连续移动。按这种方法产生的标尺称为临界频带率。它从0增加到24,单位为Bark(是为了纪念科学家巴克豪森,他引入了描述响度量级的单位“方”,这对临界频带起着非常重要的作用)。临界频带率(z)和频率(f)之间的关系对于理解人类耳朵的许多特征是很重要的。

图6-9 与相邻的临界频带序列相关的数字,其值等于临界频带率,被绘制成频率的函数。两个坐标都是线性的


临界频带率与描述听力系统特征的其他几个度量密切相关。例如,刚刚可察觉的频率增量和频率调制的阈值都与临界带宽密切相关。虽然这一关系将在第七章中讨论,但可以将刚刚可察觉的频率变化的频率依赖性与临界带宽进行比较。此外,临界带宽似乎与比率音高频率的函数相关,与频率在基底膜上最大刺激声位置的函数相关。对于比较临界带宽,刚刚可察觉的变化频率和在基底膜上刺激的位置,方便沿着基底膜方向以固定步长(0.2mm)前进,并画出频率增量, Δf,作为频率的函数对应于每一个点。在蜗孔附近,例如,在低频处,0.2mm的步长产生的频率增量约为15~20Hz。然而,在卵圆窗附近的高频处,0.2mm的步长产生的频率增量Δf约为500Hz。


这种方式产生的关系如图6-10所示,虚线表示频率增量Δf是沿基底膜0.2mm步长时的频率的函数。图6-10中另外两条实线表示临界带宽ΔfG和差阈值2Δf,对于频率调制,它们都是频率的函数。这三条曲线的形状很相似,其中一条可以通过平行向上或向下移动其他曲线得到。因为横坐标和纵坐标都是对数形式,这样平行移动对应于乘以一个特定的因子。这些因子在图中以双箭头表示,并且在频率上刚刚可察觉的调制,2Δf,大约比临界频带小25倍。频率移动,Δf,对应于基底膜上最大刺激位置0.2mm的变化,约为2Δf的4倍,但比临界频带宽度小6.3倍。这意味着,一个正弦纯音的频率沿基底膜移动2Δf产生约0.05mm的固定距离的移动。这种变化与纯音的频率和基底膜上的常量频率无关(在这个讨论中,忽略了5.1.2节中描述的频率与频率音高之间的微小差异,因为它只占很小的百分比)。临界频带的宽度对应于沿基底膜约1.3mm的距离。假设3600个毛细胞从蜗孔到卵圆窗排成一行,毗邻的毛细胞沿32mm基底膜全长约为9μm。考虑到第5章的讨论,频率调制产生的总的临界带宽和总的刚刚可觉察的步长产生相同的功能,因为这与纯音的音高和它们的频率相关,产生有趣的关系如表6-2所示。

表6-2 临界频带率距离(左列)、基底膜距离(第二列)、相邻的恰好可察觉的音高步长(第三列)、比率音高差(第四列)与相邻毛细胞等效数量之间的关系

图6-10 临界带宽ΔfG和刚刚可察觉的频率变化(2Δf)以实线形式给出,作为频率的函数。破折线表示基底膜上移动的最大位移0.2mm所需要的频率变化。双箭头表示曲线相互偏移的因子


这些关系也可以用其他尺度表示。它们当中的其中6个如图6-11所示。顶部显示为内耳和基底膜(阴影线)展开图,这样以便展示其总长度。它从低频的蜗孔开始,逐渐变小,直到高频的卵圆窗。基底膜的总长度为32毫米,第二行用线性尺度表示。第三行尺度给出了从蜗孔到卵圆窗的频率调制所能达到的刚刚可察觉的步数。总的来说,基于刚刚可察觉的调频的640步可以添加一个又一个。第四行为纯音的比率音高。它的线性尺度从0到2400mel。从0到24Bark的临界频带率在第5行上,再次以线性形式绘制。最底行是频率的尺度。它有一个非线性划分,在500Hz以前,刻度几乎是线性的,但在500Hz以上的频率,刻度几乎是按对数划分的。

图6-11 与音高相关的感知尺度转化为展开的耳蜗长度。注意,长度尺度、步数尺度、比率音高尺度和临界频带率尺度是线性的,而频率不是


从图6-11所示的尺度中,一个重要的事实变得清晰起来:频率标尺,一个物理标尺,在描述内耳产生的效应时不是很有用;在整个基底膜的长度上,线性和对数尺度都不适用。与频率相比,所有其他的尺度数值,如频率步长、纯音的比率音高和临界频带率,都可以沿着基底膜长度用线性尺度绘制出来。因此,在讨论听觉系统的特征或制作描述这些特征的详细模型时,尽可能早地使用位置变换的频率似乎是合理的。无论是临界频带率尺度还是比率音高尺度都比频率尺度更有用。在许多情况下,早期将频率转换成临界频带率足以以一种简单而独特的方式描述沿基底膜发生的效应。


频率与基底膜长度、临界频带率或纯音比率音高之间的关系是非常重要的。图6-12使用不同的频率尺度概述了这种关系,一个是线性尺度,另一个是对数尺度。有时近似是有用的,特别是当只考虑低频或高频范围时。在图中用破折线表示的这些近似,也用数字表示。在图6-12的左侧是展开的内耳,包括从蜗孔到卵圆窗的基底膜。沿着基底膜中心画的点划线可以被认为是一排内毛细胞。图(b)横坐标为线性频率,临界频带率为纵坐标,也为线性尺度。比率音高作为纵坐标显示在右边。由于低频时的临界带宽为100Hz,低频时频率与比率音高呈线性相关,且比例系数为1,因此图(b)给出的低频近似变得很明显:1Bark=100mel。可以再次提到的是,第五章中讨论的音高变化,大部分仍然在百分之几的范围内,可以被忽略。图(b)部分的破折线所示的正比例近似表明了用mel表示的比率音高等于用Hz表示的频率范围。这是控制音乐和音的范围。但在这个范围内,与用Bark表示的临界频带率也成正比,但比频率(Hz)小100倍。1Bark临界频带率的增量对应100mel的比率音高的变化。

图6-12 a-b 展开的耳蜗(a),纵坐标是临界频带率和线性的比率音高,作为线性频率(b)和对数频率(c)的函数。破折线和方程表示有用的近似


图(c)采用对数频率作为横坐标。直线破折线表明临界频带率和频率之间的对数关系在500Hz以上是一个非常有用的近似。这种近似表明Bark的增量(或100mel增量)之间的关系对应为大约20%的相对频率变化。


在许多情况下,解析表达式用于描述整个听觉频率范围内的临界频带率(和临界带宽)对频率的依赖关系。下面两个表达式已经被证明是有用的:


:翻译自Hugo Fastl,Eberhard Zwicker,Psychoacoustics:Facts and Models,Springer,2006

举报
评论 0