失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 基于数据挖掘技术优选声学参数评估儿童构音障碍的方法与流程

基于数据挖掘技术优选声学参数评估儿童构音障碍的方法与流程

时间:2023-04-17 14:29:13

相关推荐

基于数据挖掘技术优选声学参数评估儿童构音障碍的方法与流程

本发明属于构音障碍评估的技术领域,具体涉及一种基于数据挖掘技术优选声学参数评估儿童构音障碍的方法。

背景技术:

目前国内儿童语言障碍人数逐年增加,其中构音障碍导致的沟通交流障碍严重影响患儿重返社会。虽然我国构音障碍患者数量重多,但是林强和卢建亮的调查研究发现目前的评估方法并不能满足治疗师对精准言语康复的需求。国内康复科和言语康复机构应用较多的仍然是以主观听觉评价和(或)需要主观判断的量表为主要评估手段,缺乏客观性和效率。

近年来,基于人工智能技术的快速发展,如人工神经网络(artificialneuralnetwork,ann)和数据挖掘(datamining,dm)在正常语音分析与识别、语言教育、智能语音导医等方面的应用研究取得了一些成果。研究声学参数在儿童构音障碍的特征性与规律性,并基于数据挖掘和人工神经网络分析权重参数与儿童构音障碍类型间的内在机制,可以利用权重声学特征检测提高儿童病理语音评估的客观性和效率。

国外对正常儿童元音、辅音、声调的声学特征研究已经比较成熟,对儿童构音障碍病理语音的研究主要集中在脑瘫、功能性构音障碍、人工耳蜗植入、口吃等几种疾病。对母语为普通话的儿童构音障碍的声学特征分析研究较少,尤其是复合元音、声调的声学分析罕见报道。目前国内在人工智能语音分析方面,对正常语音识别研究较多,接近国际水平。但是对病理语音的数据挖掘和神经网络识别处于起步阶段,儿童构音障碍提取的病理声学特征及其变化规律,可以客观量化反映患儿构音运动障碍,是数据挖掘和ann拟合识别的前提条件,但是具体机制仍不完全清楚。

技术实现要素:

本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,通过数据挖掘的方法选择与优化用于评估儿童构音障碍的特征声学参数,筛选可能用于所有儿童构音障碍评估的综合权重因变量。

为了达到上述目的,本发明采用以下技术方案:

基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,包括下述步骤:

收集构音障碍的儿童及正常儿童的语音样本;

将语音样本使用软件剪切存档,82个语音采集点按三个程度进行随机化听懂度判断;

提取共振峰、基频、时长、vot相关的声学特征参数,以此计算出6个单元音f1和f2、f2斜率、基频中点、元音f0均值、中点值、时长、vot、vsa、vai、fcr;3个角元音的基频微扰、振幅微扰、nne;听懂度,分别用v1,v2,...,v40表示;

将每种类型的儿童构音障碍的结局设置为二分类变量,结果1表示为该种构音障碍,0表示不是,影响某种构音障碍结局的因素包括因变量(v1,v2,...,v40),设定为筛选变量,在matlab工具箱调用lasso回归函数,首先拟合广义线性模型,然后进行变量筛选,通过lasso分析可以得到,影响某种构音障碍结局的因素包括因筛选变量中的哪几个,并探讨这些影响因素所占权重,在筛选过程中要防止过度拟合,最后综合分析可以用于不同儿童构音障碍评估的综合权重因变量也就是对普通话儿童构音障碍评估具有重要意义的权重声学特征参数;

根据得到的权重声学特征参数对儿童构音障碍进行评估。

作为优选的技术方案,所述语音样本通过下述方式获取:

采用适合数字化语音分析要求的采集表《汉语普通话构音障碍评估词表》,采用该词表收集健康儿童和构音障碍儿童的语音样本,制定采样规范,通过专业录音设备在≤20dbhl语音评估室进行语音采集。

作为优选的技术方案,使用cooleditpro2.1语音分析软件剪切语音文件,将每个被试儿童的连续的语音按需要剪辑成单音节,82个语音采集点收集的数据集分为元音、辅音、声调等音素,其中涉及单元音38个,辅音23个,复合元音21个。

作为优选的技术方案,还包括对声学特征进行预处理,提取以下声学参数:

①单元音:f1(6种)、f2(6种)、vsa、vai、fcr;

②辅音:vot;

③韵律:f0中点、f0均值、基频微扰、振幅微扰、标准化声门噪声能量、时长;

④总体听懂度,发现以上声学特征参数在构音障碍识别和严重程度判断中的贡献作用,以及权重;

f1、f2提取:通过快速傅里叶变换确定周期性信号的基频,praat软件提取每个音频样本6个单元音的f1和f2同时出现和f2消失的中点值,即v1=(f1/a/),v7=(f2/a/),v2=(f1/i/),v8=(f2/i/),v3=(f1/u/),v9=(f2/u/);

vsa:元音/a/的f1和f2是v1,v7,元音/i/的f1和f2是v2,v8,元音/u/的f1和f2是v3,v9,分别代入下列公式得到vsa,即v13;

p=(a+b+c)/2

vai=(f2/i/+f1/a/)/(f1/i/+f1/u/+f2/u/+f2/a)

vai:v1,v7,v2,v8,v3,v9,分别代入下列计算公式得到vai,即v14;

fcr:v1(f1/a/),v7(f2/a/),v2(f1/i/),v8(f2/i/),v3(f1/u/),v9(f2/u/),分别代入下列计算公式得到fcr,即v15;

fcr=(f2/u/+f2/a/+f1/i/+f1/u/)/(f2/i/+f1/a)

vot:用praat软件标注并记录/pa,ta,ka/的vot,即v16,v17,v18;

f0:通过自相关法,使用praat软件提取/a,i,u/的f0轨迹,并取其中点值,即为v19,v20,v21;f0均值v22,v23,v24;基频微扰v25,v26,v27;振幅微扰v28,v29,v30;标准化声门噪声能量v31,v32,v33;

时长:用praat软件标注并记录/a,i,u,o,e,y/的时长,即v34,v35,v36,v37,v38,v39。

作为优选的技术方案,总听懂度通过下述方法获得:

采用2女1男3个听辩者,听辩者无听力损失,每个听辩者听理解后记录到的声音与目标音的完全一致则记录为2分,提示听懂度完好;每个听辩者听理解后记录到的声音与目标音的有部分不一致则记录为1分,提示听懂度部分受损;每个听辩者听理解后记录到的声音与目标音的完全不一致或为刻板无意义发音则记录为0分,提示听懂度完全受损;即,如果82个音节完全准确,听懂度量化值164(82*2),完全不正确,听懂度量化值为0(82*0),记录3位听辩者的平均值,即为v40。

作为优选的技术方案,还包括下述步骤:

建立构音障碍和正常儿童语音2个结构化儿童语音数据集(c1,c2),每个数据集下每个样本包括40个纬度语音特征,即为影响构音障碍结局的因变量(n1v1,n1v2,...,n1v40),(n2v1,n2v2,...,n2v40)……,(n200v1,n200v2,...,n200v40)。

作为优选的技术方案,所述lasso分析具体为:

将每种类型的儿童构音障碍设置为二分类结局变量y,并设定判别参数1和0,结果1表示为该种构音障碍,0表示不是;影响某种构音障碍结局的因素包括因变量(v1,v2,...,v40),该数据集(c1,c2)设定为筛选变量x1,x2,...xi,

y=θ0+θ1x1+θ2x2+θ3x3+θ4x4+…+θixi

在matlab工具箱调用lasso回归函数,首先拟合广义线性模型,然后进行变量筛选,

上述公式,j(θ)是回归系数,λ是惩罚项,λ>0,hθ为(θ0,θ1,θ2,θ3,θ4...θi),i=;j=1,2,3...k;此时求出θ趋于最小值的解。

本发明与现有技术相比,具有如下优点和有益效果:

1)普通话儿童构音障碍语音数据集是基于普通话发音特征设计采集词表建立标准化语音数据集。此词表收集时间一般不超过10分钟,包括元音、辅音、复合元音、声调语言特征,适用于定量分析与数据分析。

2)普通话儿童构音障碍声学特征的特点与规律。国际上之前没有对普通话儿童人群构音障碍进行系统的声学分析,本发明对普通话儿童构音障碍病理语音特征进行了补充。通过对卒中后构音障碍人群元音发生的元音空间分布(离散与重叠)、元音空间面积、声学距离、基频变化、基频轨迹变化的观察分析,揭示儿童构音障碍元音发生运动、声调变化是否存在着不精确性和异常运动模式的规律。通过研究结果可以为使用据挖掘,人工神经网络评估障碍类型提供基础论证。

3)通过数据挖掘方法,分析影响儿童构音障碍的声学特征。本发明国内首次采用lasso方法,分析40种声学特征参数中与各类型儿童构音障碍的相关性,发现各型儿童构音障碍的权重声学特征。探索对普通话儿童构音障碍评估最有贡献的声学参数。

附图说明

图1是本发明的方法流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

实施例

如图1所示,将每种类型的儿童构音障碍的结局设置为二分类变量,结果1表示为该种构音障碍,0表示不是,影响某种构音障碍结局的因素包括因变量(v1,v2,...,v40),设定为筛选变量,在matlab工具箱调用lasso回归函数,首先拟合广义线性模型,然后进行变量筛选,通过lasso分析可以得到,影响某种构音障碍结局的因素包括因筛选变量中的哪几个,并探讨这些影响因素所占权重,在筛选过程中要防止过度拟合,最后综合分析可以用于不同儿童构音障碍评估的综合权重因变量也就是对普通话儿童构音障碍评估具有重要意义的权重声学特征参数。

在本实施例中,在无明显干扰的室内环境中,被试儿童取端坐位,技术人员手拿sonyzoomh4npro专业录音机,使被试儿童口唇距录音机约10cm,录音之前,专业技术人员对被试儿童进行演示说明,录音期间提醒被试儿童保持语速自然平稳;开始录音后让被试儿童读取《普通话儿童构音障碍评估词表》中共82个目标音,用专业的录音设备进行录音,每个目标音重复录2次并存档。构音障碍儿童以及正常儿童的不同类型数据集分别用c1,c2表示。

使用cooleditpro2.1软件将各种类型中每位被试儿童的82个目标音分别剪切出来,命名并分类归档。提取被剪切存档目标语音的共振峰、基频、时长、vot等相关的声学特征参数,通过声学特征参数为基础分别计算或提取出先关相关客观声学指标6个单元音f1和f2、f2斜率、基频中点、元音f0均值、中点值、时长、vot、vsa、vai、fcr;3个角元音的基频微扰、振幅微扰、nne;听懂度。与此同时每位被试儿童的82个语音采集点按三个程度进行随机化听懂度判断,从而得出每种类型中每位被试儿童的声学特征参数共40个维度(分别用v1,v2,...,v40表示)。

提取以下声学参数:

①单元音:f1(6种)、f2(6种)、vsa、vai、fcr;

②辅音:vot;

③韵律:f0中点、f0均值、基频微扰、振幅微扰、标准化声门噪声能量、时长;

④总体听懂度,发现以上声学特征参数在构音障碍识别和严重程度判断中的贡献作用,以及权重;

f1、f2提取:通过快速傅里叶变换确定周期性信号的基频,praat软件提取每个音频样本6个单元音的f1和f2同时出现和f2消失的中点值,即v1=(f1/a/),v7=(f2/a/),v2=(f1/i/),v8=(f2/i/),v3=(f1/u/),v9=(f2/u/);

vsa:元音/a/的f1和f2是v1,v7,元音/i/的f1和f2是v2,v8,元音/u/的f1和f2是v3,v9,分别代入下列公式得到vsa,即v13。

p=(a+b+c)/2

vai=(f2/i/+f1/a/)/(f1/i/+f1/u/+f2/u/+f2/a)

vai:v1,v7,v2,v8,v3,v9,分别代入下列计算公式得到vai,即v14。

fcr:v1(f1/a/),v7(f2/a/),v2(f1/i/),v8(f2/i/),v3(f1/u/),v9(f2/u/),分别代入下列计算公式得到fcr,即v15。

fcr=(f2/u/+f2/a/+f1/i/+f1/u/)/(f2/i/+f1/a)

vot:用praat软件标注并记录/pa,ta,ka/的vot,即v16,v17,v18。

f0:通过自相关法,使用praat软件提取/a,i,u/的f0轨迹,并取其中点值,即为v19,v20,v21;f0均值v22,v23,v24;基频微扰v25,v26,v27;振幅微扰v28,v29,v30;标准化声门噪声能量(nne)v31,v32,v33。

时长:用praat软件标注并记录/a,i,u,o,e,y/的时长,即v34,v35,v36,v37,v38,v39。

总听懂度通过下述方法获得:

采用2女1男3个听辩者,听辩者无听力损失,每个听辩者听理解后记录到的声音与目标音的完全一致则记录为2分,提示听懂度完好;每个听辩者听理解后记录到的声音与目标音的有部分不一致则记录为1分,提示听懂度部分受损;每个听辩者听理解后记录到的声音与目标音的完全不一致或为刻板无意义发音则记录为0分,提示听懂度完全受损;即,如果82个音节完全准确,听懂度量化值164(82*2),完全不正确,听懂度量化值为0(82*0),记录3位听辩者的平均值,即为v40。

在matlab工具箱调用lasso回归函数,将每种类型的儿童构音障碍的结局设置为二分类变量,结果1表示为该种构音障碍,0表示不是;将提出以及计算出的被试儿童声学特征参数的40个维度设定为筛选变量;从而判断该种类型儿童是否为构音障碍,与此同时筛选出影响该结果的声学特征参数(例如,筛选出v1,v8,...,v22),并探讨这些影响因素所占权重。最后综合分析可以用于不同儿童构音障碍评估的综合权重因变量,也就是对普通话儿童构音障碍评估具有重要意义的权重声学特征参数。

所述lasso分析具体为:

将每种类型的儿童构音障碍设置为二分类结局变量y,并设定判别参数1和0,结果1表示为该种构音障碍,0表示不是;影响某种构音障碍结局的因素包括因变量(v1,v2,...,v40),该数据集(c1,c2)设定为筛选变量x1,x2,...xi,

y=θ0+θ1x1+θ2x2+θ3x3+θ4x4+...+θixi

在matlab工具箱调用lasso回归函数,首先拟合广义线性模型,然后进行变量筛选,

本发明从多种疾病(功能性构音障碍、脑瘫、唇腭裂术后、自闭症、脑损伤被试儿童)以及正常儿童研究,构音障碍的类型涵盖广泛;多维度(元音、辅音、声调、时长等)的结构语音数据角度提取权重声学特征参数,研究较为多样;采用lasso回归函数客观提取影响该构音障碍判断与否的声学特征参数以及其权重。多角度、多维度、客观的提取权重声学特征参数,减少主观因素造成的误差,减少技术人员技术水平的差异而导致的结果差异,提取更加真实有效且客观的数据,为儿童构音障碍的评估提供更加准确的理论依据,为被试儿童康复治疗方案的制定提供精确的方向,从而为被试儿童提供更加的个体化、客观化以及精准化的康复治疗提供基础。

本发明提出一种新的研究儿童构音障碍的方向,声学分析是通过提取患儿语音中的声学参数进行量化分析,不同类型构音障碍的声学特征可能存在各自的特点,各特征参数在不同类型障碍中可占不同权重。声学特征参数或组合可作为病理语音障碍评估的指标。本发明采集常见构音异常障碍儿童和正常儿童语音,提取录音数据中与共振峰、基频相关的多种声学特征参数,以及vsa、vai、fcr等综合参数。通过lasso挖掘影响各类障碍结局变量的多参数指标,预期发掘普通话儿童构音障碍疾病的内在声学机制,指引临床评估和分类。了解不同类型儿童构音障碍与正常儿童的声学特征差异与变化规律。通过数据挖掘,分析出影响各类发音障碍的主要声学特征。

国外对英语母语儿童构音障碍的声学特征研究,已经发现英语母语儿童构音障碍有独特声学变化与规律。国内对普通话儿童构音障碍的声学特征研究较少且单一,本发明多角度、多维度、客观的研究普通话儿童构音障碍的声学特征参数,并发现其声学特点及变化规律,为国内儿童构音障碍声学特征参数的研究提供参考依据,从而为国内儿童构音障碍的客观评估、诊断以及精准化康复做出一定的贡献。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

技术特征:

1.基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,包括下述步骤:

收集构音障碍的儿童及正常儿童的语音样本;

将语音样本使用软件剪切存档,82个语音采集点按三个程度进行随机化听懂度判断;

提取共振峰、基频、时长、vot相关的声学特征参数,以此计算出6个单元音f1和f2、f2斜率、基频中点、元音f0均值、中点值、时长、vot、vsa、vai、fcr;3个角元音的基频微扰、振幅微扰、nne;听懂度,分别用v1,v2,...,v40表示;

将每种类型的儿童构音障碍的结局设置为二分类变量,结果1表示为该种构音障碍,0表示不是,影响某种构音障碍结局的因素包括因变量(v1,v2,...,v40),设定为筛选变量,在matlab工具箱调用lasso回归函数,首先拟合广义线性模型,然后进行变量筛选,通过lasso分析可以得到,影响某种构音障碍结局的因素包括因筛选变量中的哪几个,并探讨这些影响因素所占权重,在筛选过程中要防止过度拟合,最后综合分析可以用于不同儿童构音障碍评估的综合权重因变量也就是对普通话儿童构音障碍评估具有重要意义的权重声学特征参数;

根据得到的权重声学特征参数对儿童构音障碍进行评估。

2.根据权利要求1所述基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,所述语音样本通过下述方式获取:

采用适合数字化语音分析要求的采集表《汉语普通话构音障碍评估词表》,采用该词表收集健康儿童和构音障碍儿童的语音样本,制定采样规范,通过专业录音设备在≤20dbhl语音评估室进行语音采集。

3.根据权利要求1所述基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,使用cooleditpro2.1语音分析软件剪切语音文件,将每个被试儿童的连续的语音按需要剪辑成单音节,82个语音采集点收集的数据集分为元音、辅音、声调等音素,其中涉及单元音38个,辅音23个,复合元音21个。

4.根据权利要求3所述基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,还包括对声学特征进行预处理,提取以下声学参数:

①单元音:f1(6种)、f2(6种)、vsa、vai、fcr;

②辅音:vot;

③韵律:f0中点、f0均值、基频微扰、振幅微扰、标准化声门噪声能量、时长;

④总体听懂度,发现以上声学特征参数在构音障碍识别和严重程度判断中的贡献作用,以及权重;

f1、f2提取:通过快速傅里叶变换确定周期性信号的基频,praat软件提取每个音频样本6个单元音的f1和f2同时出现和f2消失的中点值,即v1=(f1/a/),v7=(f2/a/),v2=(f1/i/),v8=(f2/i/),v3=(f1/u/),v9=(f2/u/);

vsa:元音/a/的f1和f2是v1,v7,元音/i/的f1和f2是v2,v8,元音/u/的f1和f2是v3,v9,分别代入下列公式得到vsa,即v13;

p=(a+b+c)/2

vai=(f2/i/+f1/a/)/(f1/i/+f1/u/+f2/u/+f2/a)

vai:v1,v7,v2,v8,v3,v9,分别代入下列计算公式得到vai,即v14;

fcr:v1(f1/a/),v7(f2/a/),v2(f1/i/),v8(f2/i/),v3(f1/u/),v9(f2/u/),分别代入下列计算公式得到fcr,即v15;

fcr=(f2/u/+f2/a/+f1/i/+f1/u/)/(f2/i/+f1/a)

vot:用praat软件标注并记录/pa,ta,ka/的vot,即v16,v17,v18;

f0:通过自相关法,使用praat软件提取/a,i,u/的f0轨迹,并取其中点值,即为v19,v20,v21;f0均值v22,v23,v24;基频微扰v25,v26,v27;振幅微扰v28,v29,v30;标准化声门噪声能量v31,v32,v33;

时长:用praat软件标注并记录/a,i,u,o,e,y/的时长,即v34,v35,v36,v37,v38,v39。

5.根据权利要求1所述基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,总听懂度通过下述方法获得:

采用2女1男3个听辩者,听辩者无听力损失,每个听辩者听理解后记录到的声音与目标音的完全一致则记录为2分,提示听懂度完好;每个听辩者听理解后记录到的声音与目标音的有部分不一致则记录为1分,提示听懂度部分受损;每个听辩者听理解后记录到的声音与目标音的完全不一致或为刻板无意义发音则记录为0分,提示听懂度完全受损;即,如果82个音节完全准确,听懂度量化值164(82*2),完全不正确,听懂度量化值为0(82*0),记录3位听辩者的平均值,即为v40。

6.根据权利要求5所述基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,还包括下述步骤:

建立构音障碍和正常儿童语音2个结构化儿童语音数据集(c1,c2),每个数据集下每个样本包括40个纬度语音特征,即为影响构音障碍结局的因变量(n1v1,n1v2,...,n1v40),(n2v1,n2v2,...,n2v40)……,(n200v1,n200v2,...,n200v40)。

7.根据权利要求1所述基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,其特征在于,所述lasso分析具体为:

将每种类型的儿童构音障碍设置为二分类结局变量y,并设定判别参数1和0,结果1表示为该种构音障碍,0表示不是;影响某种构音障碍结局的因素包括因变量(v1,v2,...,v40),该数据集(c1,c2)设定为筛选变量x1,x2,...xi,

y=θ0+θ1x1+θ2x2+θ3x3+θ4x4+…+θixi

在matlab工具箱调用lasso回归函数,首先拟合广义线性模型,然后进行变量筛选,

上述公式,j(θ)是回归系数,λ是惩罚项,λ>0,hθ为(θ0,θ1,θ2,θ3,θ4...θi),i=;j=1,2,3...k;此时求出θ趋于最小值的解。

技术总结

本发明公开了一种基于数据挖掘技术优选声学参数评估儿童构音障碍的方法,采取收集、提取、分析被试儿童的客观声学特征,采用LASSO回归函数,拟合广义线性模型,进行变量筛选,提取综合权重因变量,从而筛选出对普通话儿童构音障碍具有重要参考意义的声学特征参数,以及各类声学特征参数的权重,可为儿童构音障碍的客观评估夯实基础。本发明首次采用LASSO方法,分析40种声学特征参数中与各类型儿童构音障碍的相关性,发现各型儿童构音障碍的权重声学特征,探索对普通话儿童构音障碍评估最有贡献的声学参数。

技术研发人员:牟志伟;陈亮;温晓宇;江晨银

受保护的技术使用者:广州科慧健远医疗科技有限公司

技术研发日:.11.08

技术公布日:.02.18

如果觉得《基于数据挖掘技术优选声学参数评估儿童构音障碍的方法与流程》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。