失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 声音信号的处理方法 装置和交互智能设备与流程

声音信号的处理方法 装置和交互智能设备与流程

时间:2020-02-06 21:45:38

相关推荐

声音信号的处理方法 装置和交互智能设备与流程

本发明涉及信号处理领域,具体而言,涉及一种声音信号的处理方法、装置和交互智能设备。

背景技术:

随着多媒体设备的发展,对声音信息传播的要求越来越高。例如,远程会议、远程教学等场景中,在传播图像信息的同时,还需要对声音信息也进行清晰的传播。但声音在传播的过程中,经过多次反射会产生混响,从而导致接收端接收到的声音信息中会包含混响信号。而混响信号会损伤原始信号的质量,因此还需要对混响信号进行抑制,以提高声音的质量。

目前声音信号的接收端会对接收到的声音信号进行混响抑制,但目前的混响抑制方式存在复杂度高或抑制效果差的缺陷,难以两者兼得。

针对现有技术中对声音信号进行混响抑制时,难以在得到较好的抑制效果的同时保持较低的算法复杂程度的问题,目前尚未提出有效的解决方案。

技术实现要素:

本发明实施例提供了一种声音信号的处理方法、装置和交互智能设备,以至少解决现有技术中对声音信号进行混响抑制时,难以在得到较好的抑制效果的同时保持较低的算法复杂程度的技术问题。

根据本发明实施例的一个方面,提供了一种声音信号的处理方法,包括:接收原声音信号;基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制;根据第一处理结果更新线性自适应滤波器的系数;基于更新系数后的线性自适应滤波器对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制。

进一步地,在接收原声音信号之前,对线性自适应滤波器的系数进行初始化处理,设置初始时刻线性自适应滤波器的系数为预设长度的序列,序列中的每个元素的值均为0。

进一步地,获取原声音信号的信噪比,其中,信噪比为原声音信号中期望信号功率与混响信号功率的比值;根据信噪比和预设的补偿因子确定非线性滤波器;基于非线性滤波器对原声音信号进行第一滤波处理。

进一步地,确定非线性滤波器的类型,包括:确定信噪比小于信噪比阈值,确定非线性滤波器为功率谱减滤波器;或确定信噪比大于或等于信噪比阈值,确定非线性滤波器为幅度谱减滤波器。

进一步地,确定需求的失真系数大于失真系数阈值,确定非线性滤波器为维纳滤波器。

进一步地,获取线性自适应滤波器的更新增益;根据线性自适应滤波器在上一时刻的系数、更新增益和第一处理结果对线性自适应滤波的当前系数进行更新。

进一步地,线性自适应滤波器为递推最小二乘法滤波器,获取线性自适应滤波器的当前输入信号向量、当前输入信号向量的共轭转置、预设的遗忘因子、当前第一处理结果的功率和线性自适应滤波器系数的协方差矩阵;获取遗忘因子与第一处理结果的功率的第一乘积;获取当前输入信号向量的共轭转置、线性自适应滤波器系数的协方差矩阵以及当前输入信号向量的第二乘积;获取线性自适应滤波器系数的协方差矩阵与当前输入信号向量的第三乘积;获取第一乘积和第二乘积的和值;确定第三乘积与和值的比值为更新增益。

进一步地,获取线性自适应滤波器的当前系数与上一时刻的系数的变化量,其中,变化量为更新增益与第一处理结果的共轭转置的第四乘积;确定线性自适应滤波器在上一时刻的系数与变化量之和为线性自适应滤波当前的系数。

进一步地,根据更新系数后的线性自适应滤波器对线性自适应滤波器的输入信号进行处理,得到第一处理结果中混响信号的估计值;确定第一处理结果与混响信号的估计值之差为最终处理结果。

根据本发明实施例的另一方面,还提供了一种声音信号的处理装置,包括:接收模块,用于接收原声音信号;第一滤波模块,用于基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制;更新模块,用于根据第一处理结果更新线性自适应滤波器的系数;第二滤波模块,用于基于更新系数后的线性自适应滤波器对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制。

进一步地,第一滤波模块包括:第一获取子模块,用于获取原声音信号的信噪比,其中,信噪比为原声音信号中期望信号功率与混响信号功率的比值;确定子模块,用于根据信噪比和预设的补偿因子确定非线性滤波器;滤波子模块,用于基于非线性滤波器对原声音信号进行第一滤波处理。

进一步地,更新模块包括:第二获取子模块,用于获取线性自适应滤波器的更新增益;更新子模块,用于根据线性自适应滤波器在上一时刻的系数、更新增益和第一处理结果对线性自适应滤波的当前系数进行更新。

根据本发明实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的声音信号的处理方法。

根据本发明实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的声音信号的处理方法。

根据本发明实施例的另一方面,还提供了一种交互智能设备,包括:声音拾取装置,用于接收原声音信号;非线性滤波器,与声音拾取装置相连,用于对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制;线性自适应滤波器,与非线性滤波器相连,用于根据第一处理结果更新线性自适应滤波器的系数,并基于更新后的系数对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制;声音播放装置,用于播放原声音信号的最终处理结果。

在本发明实施例中,首先利用非线性滤波对音频信号进行预处理,然后用预处理得到的结果去更新线性自适应滤波器的系数。预处理会抑制一部分的混响信号,使得输入到线性滤波器中的混响功率较小。同时,预处理之后的信号相对于原始接收信号来说更加精确,也使得线性滤波器的相关系数更加准确。以上两点使得线性滤波会以更快的速度收敛,从而降低算法的复杂程度,提升对混响信号的抑制效果,进而解决了现有技术中对声音信号进行混响抑制时,难以在得到较好的抑制效果的同时保持较低的算法复杂程度技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的声音信号的处理方法的流程图;

图2是根据本发明实施例的一种可选的声音信号的处理方法的示意图;

图3a示出了单独采用线性滤波器抑制混响的过程中线性滤波器系数收敛情况;

图3b示出了根据本申请的方案联合非线性与线性滤波器抑制混响的过程中线性滤波器系数收敛情况;

图4是根据本发明实施例的一种声音信号的处理装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

根据本发明实施例,提供了一种声音信号的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的声音信号的处理方法的流程图,如图1所示,该方法包括如下步骤:

步骤S102,接收原声音信号。

具体的,上述原声音信号可以是声音发送端在采集到声音生成对象生成的声音信号后,将声音信号传输至声音接收端的信号,即设备直接接收到的声音信号。

在一种可选的实施例中,以远程会议的场景为例,声音发送端可以是会议现场的智能终端(例如:交互智能平板、平板电脑、移动终端等),会议进行过程中,会议现场的智能终端采集现场的声音信息,并将声音信息传输至远程参会现场的终端,参会现场的终端即接收到上述原声音信号。

步骤S104,基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制。

具体的,上述非线性滤波器可以由声音接收端实现。非线性滤波具有结构简单、易于实现等优点。

在一种可选的实施例中,上述非线性滤波器可以通过中值滤波、均值滤波、双边滤波、卡尔曼滤波等多种非线性滤波算法对原声音信号进行第一滤波处理,得到第一处理结果。

上述第一处理结果与原声音信号相比,已经由非线性滤波器抑制了部分混响信号,与原声音信号相比质量更高。但由于非线性滤波器对混响信号抑制的效果有限,且还会引入新的噪声,因此在使用非线性滤波器对原声音信号进行滤波处理后,还需要进入步骤S106,对第一处理结果继续进行混响抑制处理。

步骤S106,根据第一处理结果更新线性自适应滤波器的系数。

具体的,线性自适应滤波器是根据环境的改变,使用自适应算法来改变滤波器的系数的线性滤波器,也即,上述线性自适应滤波器的系数是基于预设的自适应算法更新的时变系数。通过不断的调整滤波器的系数,使滤波器能够达到其最佳性能。不同的线性滤波器具有其对应的更新算法。

本申请的上述线性自适应滤波器根据第一处理结果更新滤波器系数,从而能够得到与第一处理结果匹配的最佳线性滤波器。

步骤S108,基于更新后的线性自适应滤波器对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制。

在一种可选的实施例中,仍以上述的远程会议为例进行说明,在接收端接收到声音信息后,首先通过非线性滤波器对原声音信号进行混响抑制的第一滤波处理,基于非线性滤波器的处理结果更新线性自适应滤波器的滤波器系数,并使用更新系数后的线性自适应滤波器对第一处理结果进行进一步处理,从而完成了对原声音信息进行的混响抑制,得到质量较高的声音信息。在接收端对原声音信息进行如上处理后,再进行播放,从而使得用户能够听到质量较高的声音信息。

需要说明的是,混响抑制主要包含非线性滤波与线性滤波两类。非线性滤波对混响的抑制效果较差,并且会引入新的噪声,使得该类方法难以应用在对声音信号质量要求较高的场景中。线性滤波方法在抑制混响中具有较好的效果,但该类方法往往需要以极高的计算复杂度为代价才能换取较为理想的混响抑制效果,并且滤波器的收敛速度也会影响混响抑制效果。因此使得对声音信号进行混响抑制时,高抑制效果和低算法复杂程度难以兼得。

而本申请上述实施例首先利用非线性滤波对音频信号进行预处理,然后用预处理得到的结果去初始化线性自适应滤波器的部分系数。预处理会抑制一部分的混响信号,使得输入到线性滤波器中的混响功率较小。同时,预处理之后的信号相对于原始接收信号来说更加精确,也使得线性滤波器的相关系数更加准确。以上两点使得线性滤波会以更快的速度收敛,从而提升对混响信号的抑制效果;进一步地,本发明方案利用计算复杂度低的非线性滤波对混响信号进行预处理。预处理会抑制一部分的混响信号,使得输入到线性滤波器中的混响功率较小。线性滤波器会以较低的滤波器阶数为代价去抑制残留的混响信号,从而大大降低了该方法的执行复杂度。

作为一种可选的实施例,在接收原声音信号之前,上述方法还包括:对线性自适应滤波器的系数进行初始化处理,设置初始时刻线性自适应滤波器的系数为预设长度的序列,序列中的每个元素的值为0。

具体的,由于线性自适应滤波器需要根据第一处理结果来更新其自身的滤波器系数,因此在初始阶段,对线性自适应滤波器进行初始化。在一种可选的实施例中,初始化线性滤波器的长度L,可以设置零时刻的线性滤波器系数值为0,也即GL×1=(0,0,…,0)Τ,其中(·)T表示转置操作。

作为一种可选的实施例,基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,包括:获取原声音信号的信噪比,其中,信噪比为原声音信号中期望信号功率与混响信号功率的比值;根据信噪比和预设的补偿因子确定非线性滤波器;基于非线性滤波器对原声音信号进行第一滤波处理。

具体的,原声音信号的信噪比(SNR,Signal-Noise Ratio)可以是电子设备或者电子系统中信号与噪声的比例。在本申请的方案中,信噪比用于表示原声音信号中,正常声音信息与混响信息的比值。

在一种可选的实施例中,已接收的声音信息可以表示为Y=S+N,其中,S用于表示期望信号,N用于表示需要被抑制的混响信号,Y用于表示接收端接收到的原声音信息。上述原声音信息的信噪比,可以为期望信号的信号功率与混响信号的信号功率的比。以公式可以表示为:其中,E[S2]用于表示期望信号的信号功率,E[N2]用于表示混响信号的信号功率。

上述预设的补偿因子可以为经验值,在一种可选的实施例中,可以通过如下公式表示上述非线性滤波器:其中,μ用于表示预设的补偿因子,SNR用于表示原声音信号的信噪比,α和β用于表示非线性滤波器的类型,其中,当α=0.5,β=1时,W表示功率谱减滤波器;当α=1,β=0.5时,W表示幅度谱减滤波器;当α=1,β=1时,W表示维纳滤波器。

在获得非线性滤波器W后,可以使用非线性滤波器W对原声音信号进行第一滤波处理,得到第一处理结果。该第一处理结果即为非线性滤波器W的估计输出。

仍在上述实施例中,非线性滤波器的估计输出可以为:其中,W用于表示上述非线性滤波器在每个频域每个频点的数值,Y用于表示原声音信号每个频点的值,用于表示非线性滤波器对期望信号S在频域的估计值。

本申请上述实施例中,以及原声音信号本身的系数(原声音信号的信噪比)确定非线性滤波器,并使用确定的非线性滤波器,对原声音信号进行第一滤波处理,进而得到了非线性滤波器对期望信号的估计值,即第一处理结果。第一处理结果与原声音信号相比,已抑制了部分混响信号,但抑制效果有限,且引入了新的噪声,因此需要有线性自适应滤波器对非线性滤波器的输出继续进行第二滤波处理,

作为一种可选的实施例,上述方法还包括:确定非线性滤波器的类型,包括:确定信噪比小于信噪比阈值,确定非线性滤波器为功率谱减滤波器;或确定信噪比大于或等于信噪比阈值,确定非线性滤波器为幅度谱减滤波器。

具体的,为了确定用于对原声音信号进行第一滤波处理的非线性滤波器,还要确定非线性滤波器的类型。在一种可选的实施例中,非线性滤波器的类型,可以通过调整上述α和β来确定非线性滤波器的类型。

当信噪比较大时,幅度谱减滤波器具有较好混响抑制效果;当信噪比较小时,功率谱减滤波器具有较好的混响抑制效果,因此上述方案中,通过原声音信号的信噪比,以及预设的信噪比阈值来确定非线性滤波器的类型。

在一种可选的实施例中,将原声音信号的信噪比与预设的信噪比阈值进行比对,当原声音信号的信噪比小于信噪比阈值时,可以设置α=0.5,β=1,以使W表示功率谱减滤波器;当原声音信号的噪声大于或等于噪声比阈值的情况下,可以设置α=1,β=0.5,以使W表示幅度谱减滤波器。

由此,本申请上述实施例通过原声音信号的噪声比确定非线性滤波器的类型,并通过调整滤波器的系数来调整非线性滤波器的类型,从而使得非线性滤波器与原声音信号的特征更加匹配。

作为一种可选的实施例,确定非线性滤波器的类型的步骤还包括:确定需求的失真系数大于失真系数阈值,确定非线性滤波器为维纳滤波器。

具体的,上述失真系数可以是失真度。失真度是使用一个未经放大器放大前的信号与经过放大器放大后的信号作比较,被放大的信号与原信号的差别即为失真度。失真度的值越大,则经过放大器放大或的信号与原信号的差别越大。

在一种场景下,对声音的保真要求加高,因此确定非线性滤波器的类型为维纳滤波器,从而能在对原声音信号进行混响抑制处理时,保证原声音信号不过度失真。

作为一种可选的实施例,基于线性自适应滤波器对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,包括:获取线性自适应滤波器的更新增益;根据线性自适应滤波器在上一时刻的系数、更新增益和第一处理结果对线性自适应滤波的当前系数进行更新。

需要说明的是,不同类型的线性自适应滤波器具有对应的用于更新滤波器系数的算法准则。

在上述方案中,在获取到线性自适应滤波器的更新增益后,线性自适应滤波器根据第一处理结果,线性自适应滤波器在上一时刻的系数以及获取的当前的更新增益,对上一时刻的系数进行更新,得到线性自适应滤波器在当前时刻的系数。通过上述方案,使得线性自适应滤波器的系数与非线性滤波器对原声音信号的处理结果相关联,从而使得线性自适应滤波器能够随时调整其系数,达到与第一处理结果最匹配的最佳状态。

作为一种可选的实施例,线性自适应滤波器为递推最小二乘法滤波器,获取线性自适应滤波器的更新增益,包括:获取线性自适应滤波器的当前输入信号向量、当前输入信号向量的共轭转置、预设的遗忘因子、当前第一处理结果的功率和线性自适应滤波器系数的协方差矩阵;获取遗忘因子与第一处理结果的功率的第一乘积;获取当前输入信号向量的共轭转置、线性自适应滤波器系数的协方差矩阵以及当前输入信号向量的第二乘积;获取线性自适应滤波器系数的协方差矩阵与当前输入信号向量的第三乘积;获取第一乘积和第二乘积的和值;确定第三乘积与和值的比值为更新增益。

具体的,上述线性自适应滤波器可以为LMS(Least Mean Square,最小均方差)滤波器、RLS滤波器或Kalman滤波器。不同类型的线性自适应滤波器根据其所对应的更新准则进行更新增益。

上述线性自适应滤波器的当前输入信号向量包括当前时刻的原声音信号向量、上一时刻的原声音信号向量……,以及前(L+1)时刻的原声音信号向量,其中,L为线性自适应滤波器的长度。可以使用如下公式表示线性自适应滤波器的当前输入信号向量:X(n)=(Y(n),Y(n-1),...,Y(n-L+1))T,其中,X(n)为线性自适应滤波器的当前输入信号向量,Y(n)为原声音信号向量。

第一处理结果即为非线性滤波器输出的期望声音信号的估计值,因此当前第一处理结果的功率即为当前期望信号估计值的功率。

上述递推最小二乘法滤波器即为基于递推最小二乘法(Recursive Least Square,RLS)的滤波器。在一种可选的实施例中,可以通过如下公式表示获取递推最小二乘法滤波器的更新增益的方式:

其中,K∈CL×1用于表示RLS滤波器的更新增益向量;XH表示X的共轭转置;Φ∈CL×L表示线性自适应滤波器在上一时刻的系数G(n-1)的协方差矩阵;X用于表示当前输入信号向量,其中,第n时刻的滤波器输入为X(n)=(Y(n),Y(n-1),...,Y(n-L+1))T;λ表示遗忘因子。表示当前期望音频信号的功率。在上述示例中,λδ2为第一乘积,XΗΦX为第二乘积,ΦX为第三乘积。

作为一种可选的实施例,根据线性自适应滤波器在上一时刻的系数、更新增益和第一处理结果对线性自适应滤波的当前系数进行更新,包括:获取线性自适应滤波器的当前系数与上一时刻的系数的变化量,其中,变化量为更新增益与第一处理结果的共轭转置的第四乘积;确定线性自适应滤波器在上一时刻的系数与变化量之和为线性自适应滤波当前的系数。

在上述方案中,通过更新增益和第一处理结果确定线性自适应滤波器的系数的变化量,再根据该变化量,在线性自适应滤波器在上一时刻的系数的基础上确定线性自适应滤波器当前的系数。

在一种可选的实施例中,可以通过如下公式对线性自适应滤波器的系数进行更新:

其中,G(n)表示线性自适应滤波器当前的系数,G(n-1)表示线性自适应滤波器上一时刻的系数,K表示更新增益向量,表示第一处理结果的共轭转置,即非线性滤波器对期望信号的估计值的共轭转置。具体的,G(n)中的第i个元素可以表示为

作为一种可选的实施例,基于更新系数后的线性自适应滤波器对第一处理结果进行第二滤波处理,包括:根据更新系数后的线性自适应滤波器对线性自适应滤波器的输入信号进行处理,得到第一处理结果中混响信号的估计值;确定第一处理结果与混响信号的估计值之差为最终处理结果。

具体的,上述更新系数后的自适应滤波器,使用更新后的系数对混响信号的估计值进行运算。在得到第一处理结果中的混响信号的估计值后,使用第一处理结果减去该估计值,即可得到最终处理结果。

在一种可选的实施例中,可以通过如下公式得到最终处理结果:

其中,Sl表示最终处理结果,表示第一处理结果,G表示线性自适应滤波器的系数向量,X表示线性自适应滤波器的输入信号向量,且X(n)=(Y(n),Y(n-1),...,Y(n-L+1))T。具体的,GHX的计算可以表示为:

其中G*(i)表示G中第i个元素的共轭。X(i)表示X的第i个元素。

图2是根据本发明实施例的一种可选的声音信号的处理方法的示意图,下面结合图2对本申请中的声音信号的处理方法的一种可选的实施例进行说明。

首先,接收端接收到发送端传输的原声音信号Y(n),由非线性滤波器对原声音信号Y(n)进行第一滤波处理,得到第一处理结果

然后基于第一处理结果和线性自适应滤波器的输入信号X(n)=(Y(n),Y(n-1),...,Y(n-L+1))T确定线性自适应滤波器的更新增益K。再基于第一处理结果更新增益K和线性自适应滤波器上一时刻的系数G(n-1),对线性自适应滤波器的系数进行更新,得到线性自适应滤波器当前的系数G(n)。

最后基于线性自适应滤波器的输入信号X(n),线性自适应滤波器当前的系数G(n),以及第一处理结果得到最终处理结果Sl。

下面对本申请能够达到的效果进行说明。通过本申请提供的将非线性滤波器与线性自适应滤波器进行结合对声音信号进行抑制混响的方案,使得信号在时间轴上的拖尾情况得到了改善,且其改善效果优于单独使用非线性滤波器对声音信号进行混响抑制处理的方案。

图3a示出了单独采用线性滤波器抑制混响的过程中线性滤波器系数收敛情况。图3b示出了根据本申请的方案联合非线性与线性滤波器抑制混响的过程中线性滤波器系数收敛情况。图中横轴表示采样点的数目,纵轴表示线性滤波器系数的平均值。通过图3a与图3b可知,采用本申请中联合非线性与线性滤波器的结构,能够加速线性滤波器的收敛速度,从而提升线性滤波器的性能。

进一步地,运算复杂度主要存在于线性滤波器的计算过程中,其计算复杂度与滤波器长度的平方成正比。通过对比3a与图3b可知,在线性滤波器长度保持不变的情况下,联合非线性与线性滤波器的收敛速度远远高于线性滤波器,也即,联合非线性与线性滤波器对混响抑制效果要好于线性滤波器。那么,在达到同样的混响抑制效果的情况下,联合滤波器中线性滤波器的长度可以适当降低,从而降低了整体的运算复杂度。

实施例2

根据本发明实施例,提供了一种声音信号的处理装置的实施例,图4是根据本发明实施例的一种声音信号的处理装置的示意图,结合图4所示,该装置包括:

接收模块40,用于接收原声音信号。

第一滤波模块42,用于基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制。

更新模块44,用于根据第一处理结果更新线性自适应滤波器的系数。

第二滤波模块46,用于基于更新系数后的线性自适应滤波器对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制。

作为一种可选的实施例,上述装置还包括:初始化模块,用于在接收原声音信号之前,对线性自适应滤波器的系数进行初始化处理,设置初始时刻线性自适应滤波器的系数为预设长度的序列,序列中的每个元素的值均为0。

作为一种可选的实施例,第一滤波模块包括:第一获取子模块,用于获取原声音信号的信噪比,其中,信噪比为原声音信号中期望信号功率与混响信号功率的比值;确定子模块,用于根据信噪比和预设的补偿因子确定非线性滤波器;滤波子模块,用于基于非线性滤波器对原声音信号进行第一滤波处理。

作为一种可选的实施例,上述方法还包括:确定模块,用于确定非线性滤波器的类型,确定模块包括:第一确定子模块,用于确定信噪比小于信噪比阈值,确定非线性滤波器为功率谱减滤波器;或第二确定子模块,用于确定信噪比大于或等于信噪比阈值,确定非线性滤波器为幅度谱减滤波器。

作为一种可选的实施例,确定模块还包括:第三确定子模块,用于确定需求的失真系数大于失真系数阈值,确定非线性滤波器为维纳滤波器。

作为一种可选的实施例,更新模块包括:第二获取子模块,用于获取线性自适应滤波器的更新增益;更新子模块,用于根据线性自适应滤波器在上一时刻的系数、更新增益和第一处理结果对线性自适应滤波的当前系数进行更新。

作为一种可选的实施例,线性自适应滤波器为递推最小二乘法滤波器,第二获取子模块包括:第一获取单元,用于获取线性自适应滤波器的当前输入信号向量、当前输入信号向量的共轭转置、预设的遗忘因子、当前第一处理结果的功率和线性自适应滤波器系数的协方差矩阵;第二获取单元,用于获取遗忘因子与第一处理结果的功率的第一乘积;第三获取单元,用于获取当前输入信号向量的共轭转置、线性自适应滤波器系数的协方差矩阵以及当前输入信号向量的第二乘积;第四获取单元,用于获取线性自适应滤波器系数的协方差矩阵与当前输入信号向量的第三乘积;第五获取单元,用于获取第一乘积和第二乘积的和值;第一确定单元,用于确定第三乘积与和值的比值为更新增益。

作为一种可选的实施例,更新子模块包括:第六获取单元,用于获取线性自适应滤波器的当前系数与上一时刻的系数的变化量,其中,变化量为更新增益与第一处理结果的共轭转置的第四乘积;第二确定单元,用于确定线性自适应滤波器在上一时刻的系数与变化量之和为线性自适应滤波当前的系数。

作为一种可选的实施例,第二滤波模块包括:处理子模块,用于根据更新系数后的线性自适应滤波器对线性自适应滤波器的输入信号进行处理,得到第一处理结果中混响信号的估计值;第四确定子模块,用于确定第一处理结果与混响信号的估计值之差为最终处理结果。

需要说明的是,本实施例中的声音信号的处理装置具备与实施例1相同的功能,并能够达到与实施例1相同的效果。

实施例3

根据本发明实施例,提供了一种存储介质,存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行实施例1所述的声音信号的处理方法。

需要说明的是,本实施例中的存储介质所存储的程序在运行时具备与实施例1相同的功能,并能够达到与实施例1相同的效果。

实施例4

根据本发明实施例,提供了一种处理器,处理器用于运行程序,其中,所述程序运行时执行实施例1所述的声音信号的处理方法。

需要说明的是,本实施例中的处理器执行实施例1中的声音信号的处理方法时,具备与实施例1相同的功能,并能够达到与实施例1相同的效果。

实施例5

根据本发明实施例,提供了一种交互智能设备,包括:

声音拾取装置,用于接收原声音信号;

非线性滤波器,与声音拾取装置相连,用于对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制;

线性自适应滤波器,与非线性滤波器相连,用于根据第一处理结果更新线性自适应滤波器的系数,并基于更新后的系数对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制;

声音播放装置,用于播放原声音信号的最终处理结果。

本申请上述实施例提出的交互智能设备,在接收到原声音信号后,会通过滤波器首先利用非线性滤波对音频信号进行预处理,然后用预处理得到的结果去初始化线性自适应滤波器的部分系数。预处理会抑制一部分的混响信号,使得输入到线性滤波器中的混响功率较小。同时,预处理之后的信号相对于原始接收信号来说更加精确,也使得线性滤波器的相关系数更加准确。以上两点使得线性滤波会以更快的速度收敛,从而提升对混响信号的抑制效果。进一步地,本实施例的上述方案利用计算复杂度低的非线性滤波对混响信号进行预处理。预处理会抑制一部分的混响信号,使得输入到线性滤波器中的混响功率较小。线性滤波器会以较低的滤波器阶数为代价去抑制残留的混响信号,从而大大降低了交互智能设备对原声音信号进行滤波的复杂度。

需要说明的是,本实施例中的非线性滤波器和线性自适应滤波器均可以是通过电子元器件构成的滤波电路,也可以是执行响应步骤的处理器。

还需要说明的是,滤波器执行上述步骤的具体实施例可见实施例1,且本实施例中的非线性滤波器和线性自适应滤波器还能够执行实施例1中的其他步骤,此处不再赘述。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:

1.一种声音信号的处理方法,其特征在于,包括:

接收原声音信号;

基于非线性滤波器对所述原声音信号进行第一滤波处理,得到第一处理结果,其中,所述第一滤波处理用于对所述原声音信号进行混响抑制;

根据所述第一处理结果更新线性自适应滤波器的系数;

基于更新系数后的线性自适应滤波器对所述第一处理结果进行第二滤波处理,输出所述原声音信号的最终处理结果,其中,所述第二滤波处理用于对所述第一处理结果进行混响抑制。

2.根据权利要求1所述的方法,其特征在于,在接收原声音信号之前,所述方法还包括:

对所述线性自适应滤波器的系数进行初始化处理,设置初始时刻所述线性自适应滤波器的系数为预设长度的序列,所述序列中的每个元素的值均为0。

3.根据权利要求1所述的方法,其特征在于,所述基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,包括:

获取所述原声音信号的信噪比,其中,所述信噪比为所述原声音信号中期望信号功率与混响信号功率的比值;

根据所述信噪比和预设的补偿因子确定非线性滤波器;

基于所述非线性滤波器对所述原声音信号进行所述第一滤波处理。

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:确定所述非线性滤波器的类型,包括:

确定所述信噪比小于信噪比阈值,确定所述非线性滤波器为功率谱减滤波器;或

确定所述信噪比大于或等于所述信噪比阈值,确定所述非线性滤波器为幅度谱减滤波器。

5.根据权利要求4所述的方法,其特征在于,确定所述非线性滤波器的类型的步骤还包括:

确定需求的失真系数大于失真系数阈值,确定所述非线性滤波器为维纳滤波器。

6.根据权利要求1所述的方法,其特征在于,根据所述第一处理结果更新线性自适应滤波器的系数,包括:

获取所述线性自适应滤波器的更新增益;

根据所述线性自适应滤波器在上一时刻的系数、所述更新增益和所述第一处理结果对所述线性自适应滤波的当前系数进行更新。

7.根据权利要求6所述的方法,其特征在于,所述线性自适应滤波器为递推最小二乘法滤波器,获取所述线性自适应滤波器的更新增益,包括:

获取所述线性自适应滤波器的当前输入信号向量、所述当前输入信号向量的共轭转置、预设的遗忘因子、当前第一处理结果的功率和所述线性自适应滤波器系数的协方差矩阵;

获取所述遗忘因子与所述第一处理结果的功率的第一乘积;

获取所述当前输入信号向量的共轭转置、所述线性自适应滤波器系数的协方差矩阵以及所述当前输入信号向量的第二乘积;

获取所述线性自适应滤波器系数的协方差矩阵与所述当前输入信号向量的第三乘积;

获取所述第一乘积和第二乘积的和值;

确定所述第三乘积与所述和值的比值为所述更新增益。

8.根据权利要求6所述的方法,其特征在于,根据所述线性自适应滤波器在上一时刻的系数、所述更新增益和所述第一处理结果对所述线性自适应滤波的当前系数进行更新,包括:

获取所述线性自适应滤波器的当前系数与上一时刻的系数的变化量,其中,所述变化量为所述更新增益与所述第一处理结果的共轭转置的第四乘积;

确定所述线性自适应滤波器在上一时刻的系数与所述变化量之和为所述线性自适应滤波当前的系数。

9.根据权利要求1所述的方法,其特征在于,基于更新系数后的线性自适应滤波器对所述第一处理结果进行第二滤波处理,包括:

根据更新系数后的线性自适应滤波器对所述线性自适应滤波器的输入信号进行处理,得到所述第一处理结果中混响信号的估计值;

确定所述第一处理结果与所述混响信号的估计值之差为所述最终处理结果。

10.一种声音信号的处理装置,其特征在于,包括:

接收模块,用于接收原声音信号;

第一滤波模块,用于基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,其中,所述第一滤波处理用于对所述原声音信号进行混响抑制;

更新模块,用于根据所述第一处理结果更新线性自适应滤波器的系数;

第二滤波模块,用于基于更新系数后的线性自适应滤波器对所述第一处理结果进行第二滤波处理,输出所述原声音信号的最终处理结果,其中,所述第二滤波处理用于对所述第一处理结果进行混响抑制。

11.根据权利要求10所述的装置,其特征在于,所述第一滤波模块包括:

第一获取子模块,用于获取所述原声音信号的信噪比,其中,所述信噪比为所述原声音信号中期望信号功率与混响信号功率的比值;

确定子模块,用于根据所述信噪比和预设的补偿因子确定非线性滤波器;

滤波子模块,用于基于所述非线性滤波器对所述原声音信号进行所述第一滤波处理。

12.根据权利要求10所述的装置,其特征在于,所述更新模块包括:

第二获取子模块,用于获取所述线性自适应滤波器的更新增益;

更新子模块,用于根据所述线性自适应滤波器在上一时刻的系数、所述更新增益和所述第一处理结果对所述线性自适应滤波的当前系数进行更新。

13.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至9中任意一项所述的声音信号的处理方法。

14.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至9中任意一项所述的声音信号的处理方法。

15.一种交互智能设备,其特征在于,包括:

声音拾取装置,用于接收原声音信号;

非线性滤波器,与所述声音拾取装置相连,用于对所述原声音信号进行第一滤波处理,得到第一处理结果,其中,所述第一滤波处理用于对所述原声音信号进行混响抑制;

线性自适应滤波器,与所述非线性滤波器相连,用于根据所述第一处理结果更新线性自适应滤波器的系数,并基于更新后的系数对所述第一处理结果进行第二滤波处理,输出所述原声音信号的最终处理结果,其中,所述第二滤波处理用于对所述第一处理结果进行混响抑制;

声音播放装置,用于播放所述原声音信号的最终处理结果。

技术总结

本发明公开了一种声音信号的处理方法、装置和交互智能设备,应用于信号处理领域。其中,该方法包括:接收原声音信号;基于非线性滤波器对原声音信号进行第一滤波处理,得到第一处理结果,其中,第一滤波处理用于对原声音信号进行混响抑制;根据第一处理结果更新线性自适应滤波器的系数;基于更新系数后的线性自适应滤波器对第一处理结果进行第二滤波处理,输出原声音信号的最终处理结果,其中,第二滤波处理用于对第一处理结果进行混响抑制。本发明解决了现有技术中对声音信号进行混响抑制时,难以在得到较好的抑制效果的同时保持较低的算法复杂程度的技术问题,达到了在保证抑制效果的同时降低执行复杂度的目的。

技术研发人员:王亮亮

受保护的技术使用者:广州视源电子科技股份有限公司

技术研发日:.07.09

技术公布日:.09.27

如果觉得《声音信号的处理方法 装置和交互智能设备与流程》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。