失眠网 > 数字信号处理--语音信号变声报告

数字信号处理--语音信号变声报告

时间：2021-12-27 11:52:01

相关推荐

数字信号处理--语音信号变声报告

一、实验目标：

把自己（男）的声音分别变成小孩的声音、女人的声音和老人的声音。

二、变声原理:

语音科学家将人类发声过程视作一个由声门源输送的气流经以声道、口、鼻腔组成的滤波器调制而成的。人类语音可分为有声语音和无声语音，前者是由声带振动激励的脉冲信号经声腔调制变成不同的音，它是人类语言中元音的基础，声带振动的频率称为基频。

无声语音则是声带保持开启状态，禁止振动引发的。一般来说，由声门振动决定的基频跟说话人的性别特征有关，如下表，而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数——共振峰频率的分布有关。儿童由于声道短，其共振峰频率高于成年人，成年女性的声道一般短于成年男性，所以女性的共振峰频率一

般高于男性。

由上可知，在进行性别变声时，主要考虑基频和共振峰频率的变化。当基频伸展，共振峰频率也同时伸展时，可由男声变成女声，女声变成童声；反之，基频收缩，共振峰频率也同时收缩时，则由童声变女声，女声变男声。为了获得自然度、真实感较好的变声效果，基频和共振峰频率通常必须各自独立地伸缩变化如图1。

图1 基频和共振峰频率分布的变化

共振峰频率的改变是基于重采样实现的，从重采样原理知道，这也同时引发了基频的变化，为保证基频变化和共振峰频率变化的独立、互不相关，在基频移动时必须考虑抵消重采样带来的偏移，理论上只要基频检测足够精确，确实可以保证基频改变和共振峰频率改变间的互不相关。

三、设计方案：

1、录入自己（小孩、女人、老人）的一段声音

2、用MATLAB做fft得到其频谱

3、做fft频谱分析

4、搬移和改变基频、语速，实现变声

四、程序实现

1、变大变小声音

[y,Fs]=audioread('C:\Users\ASUS\Desktop\杜\隋佳新.wav');%读出信号，采样率和采样位数。 sound(0.5*y,Fs)%变小声音filename = ('C:\Users\ASUS\Desktop\杜\变小.wav'); %给文件取名audiowrite(filename,0.5*y,fs) %存储.wav音频文件，在这里文件名sound(2*y,Fs)%变大声音filename2 = ('C:\Users\ASUS\Desktop\杜\变大.wav'); %给文件取名audiowrite(filename2,2*y,fs) %存储.wav音

2、原语音信号频谱分析然后频谱搬移调速改变声音

%这次作业录制的语音信号是WAV格式，通过audioread（）函数读取了语音数字信号的采样频率和数据。%首先观察原始语音的频谱和波形clearclc[s,fs]=audioread('C:\Users\ASUS\Desktop\杜\原声.wav');%声音读取s = s/max(s); %归一化L = length(s);% 读入语音长度S=fft(s,L);figuresubplot(2,1,1);plot(s);title('原语音信号波形');subplot(2,1,2);plot(abs(S));title('原语音信号频谱');fs2=fs-25000;%基频搬移到男生频谱段audiowrite('C:\Users\ASUS\Desktop\杜\女变男.wav',s,1.2*fs2)%对速度进行改变

（1）根据以上频谱知，该女生的语音信号频谱在230HZ左右，对其进行搬移到[50, 180] 之间，并进行变速就可得到男声，老年声。代码如下：

fs2=fs-25000;%基频搬移到男生频谱段

audiowrite(‘C:\Users\ASUS\Desktop\女变男.wav’,s,1.2*fs2)%对速度进行改变

（2）通过对输出音频进行分析知该方案可行，有实验程序知：

```cppfunction Y=voice(x,f) %更改采样率使基频改变 f>1降低;f<1升高f=f+0.15;f=round(f*1000);d=resample(x,f,1000); %时长整合使语音文件恢复原来时长W=400;Wov=W/2;Kmax=W*2;Wsim=Wov;xdecim=8;kdecim=2; X=d';F=f/1000;Ss =W-Wov;xpts = size(X,2);ypts = round(xpts / F);Y = zeros(1, ypts);xfwin = (1:Wov)/(Wov+1);ovix = (1-Wov):0; newix = 1:(W-Wov);simix = (1:xdecim:Wsim) - Wsim;padX = [zeros(1, Wsim), X, zeros(1,Kmax+W-Wov)];Y(1:Wsim) = X(1:Wsim); lastxpos = 0; km = 0;for ypos = Wsim:Ss:(ypts-W)xpos = round(F * ypos);kmpred = km + (xpos - lastxpos);lastxpos = xpos;if (kmpred <= Kmax)km = kmpred;elseysim = Y(ypos + simix);rxy = zeros(1, Kmax+1);rxx = zeros(1, Kmax+1);Kmin = 0;for k = Kmin:kdecim:Kmaxxsim = padX(Wsim + xpos + k + simix);rxx(k+1) = norm(xsim);rxy(k+1) = (ysim * xsim');endRxy = (rxx ~= 0).*rxy./(rxx+(rxx==0));km = min(find(Rxy == max(Rxy))-1);endxabs = xpos+km;Y(ypos+ovix) = ((1-xfwin).*Y(ypos+ovix)) + (xfwin.*padX(Wsim+xabs+ovix));Y(ypos+newix) = padX(Wsim+xabs+newix);endend

（3）调用该函数的脚本文件为：```bash[y,fs]=audioread('C:\Users\ASUS\Desktop\杜\小学生的语音.wav'); %读取声音文件x1=y(:,1); %读入的y矩阵有两列,取第1列，取一个通道sound(voice(x1,2),fs);N=length(voice(x1,1.5)); %长度n=0:N-1;w=2*n*pi/N;y1=fft(voice(x1,1.5)); %对原始信号做FFT变换subplot(2,1,1);plot(n,voice(x1,1.5)) %做原始语音信号的时域波形图title('变声语音信号时域图');xlabel('时间t');ylabel('幅值');subplot(2,1,2); %做原始语音信号的频谱图plot(w/pi,abs(y1));title('变声语音信号频谱')xlabel('频率');ylabel('幅度');filename = ('C:\Users\ASUS\Desktop\杜\变老人.wav'); %给文件取名audiowrite(filename,x_z,fs) %存储.wav音频文件，在这里文件名

上述函数代码可通过更改采样率使基频改变 f>1降低;f<1升高来改变声音频率进行变声。

五、结论

1改变频谱可以实现变声；

2改变基频可以变声；

3共振峰与基频是变声的重点；

4、MATLAB可以做频谱分析，通过这次作业我更深的理解了MATLAB这个工具。

5、编程基本可以实现变声。目标可以实现！

六、实验组讨论

如果觉得《数字信号处理--语音信号变声报告》对你有帮助，请点赞、收藏，并留下你的观点哦！

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。