失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 语音识别中文词典生成拼音词典 再生成mlf标签文件

语音识别中文词典生成拼音词典 再生成mlf标签文件

时间:2020-03-13 06:42:29

相关推荐

语音识别中文词典生成拼音词典 再生成mlf标签文件

中文词典通过pypinyin库转化为拼音词典,再将拼音词典通过zh2py.py转化为mlf标签文件

将zh2py.py代码附上,供大家参考。

#-*- coding:utf-8 -*-import os,sysdef to_mlf(xi):d=[]eng=[]for x in xi:u=xif len(u)==1:eng.append(str(u))else:if len(eng)>0:d.append("".join(eng).upper())eng=[]d.append(str(u, encoding='utf-8'))if len(eng)>0:# d.append("".join(eng).lower())d.append("".join(eng))return ddef fn_to_lab(s):x=s.split()print('sil')print('sil')for i in x:d=to_mlf(i.strip())if len(d)>0:print("\n".join(d))print('sil')print('sil')print('.')fn="dict.txt"print('#!MLF!#')for l in open(fn):l=l.strip()x=l.split()k=str(x[0].strip())v=" ".join(x[1:])print('"*/%s.lab"' % k)fn_to_lab(v)

生成后的mlf文件格式如下:

#!MLF!#"*/3300100001.lab"silsilzui4da4yin1liang4silsil."*/3300100002.lab"silsilba1xiao3shi2hou4kai1ji1silsil."*/3300100003.lab"silsilguan1bi4yu3yin1bo1bao4silsil.

如果觉得《语音识别中文词典生成拼音词典 再生成mlf标签文件》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。