失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 百度AI开发者大会输入法现场大飙Rap!高难度中英文混合语音识别惊艳全场

百度AI开发者大会输入法现场大飙Rap!高难度中英文混合语音识别惊艳全场

时间:2024-06-15 06:22:49

相关推荐

百度AI开发者大会输入法现场大飙Rap!高难度中英文混合语音识别惊艳全场

现代职场流行说话夹杂中英文,百度输入法上线了这个神器!在7月3日“Baidu Create”百度AI开发者大会现场,百度首席技术官王海峰在演讲中表示,“百度研发了流式多级的截断注意力模型(SMLTA),使语音识别的准确率大幅提升并保持了非常高的速度,这是首个基于流式注意力的语音识别线上服务,百度输入法语音识别的准确率因此相对提升15%以上”。

(百度AI开发者大会百度CTO王海峰博士分享SMLTA模型)

“你的这个新model效果比baseline好多少,探索技术的depth和scope是我们的责任,我很喜欢barrier这个词,AI的value其实就是break barrier”,这是百度语音技术部负责人高亮在现场面对百度输入法念出的一段高难度“Rap”,这样一段复杂的中英文混合“Rap”不仅被百度输入法零误差地识别出来,语音输入得到了准确理解并根据语义进行正确断句,百度输入法的语音识别还保持了非常快的速度,边说边上屏,无需等待整句念完便可呈现识别结果。这不仅是输入法行业的重大变革,也代表着未来的人机交互有更多的可能。

(百度语音技术部高亮现场评测百度输入法中英自由说)

1月百度输入法上线中英文自由说功能,深受用户喜爱。通过语音识别算法SMLTA模型,百度输入法对中文音节和英文音素混合建模,并基于海量纯中文、纯英文和中英文三类数据进行模型训练,再将中文、英文和中英混合三个语言模型并行解码,融合标点和大小写进行处理。也正是基于以上AI技术支持,百度输入法还可以支持方言自由说,方言与方言、方言与普通话混合输入免切换,精确的识别结果让语音输入不再是“普通话考试”。

语音输入日益成为输入法行业新的增长点,百度输入法作为百度AI能力应用落地的重要产品之一,具有天然的语音技术优势。自初,百度输入法公布在线语音识别、离线语音识别、中英自由说、方言自由说四大语音输入功能突破后,技术突破持续深入。目前,离线语音识别准确率已达到在线语音识别效果,效果提升的同时还降低了模型大小,占用更少的内存,离线和在线语音输入之间还可无缝切换。截止目前,百度输入法日均语音请求量峰值已突破6.2亿次,稳坐语音输入法行业头把交椅。

从手写输入到打字输入再到AI输入,百度输入法正在打造融合了语音、AR、视觉、知识图谱、自然语言处理等多项AI技术的“全感官输入”体验,此前百度输入法AI探索版已上线“拍立活”、“秀场”、“凌空手写”等功能,展开了对更多输入场景的探索。百度输入法通过对场景、用户的深度洞察和在技术领域的不断创新,实现在“新交互”“新表达”“新探索”三个方面全面升级,名副其实是行业领先的“AI输入法”。

百度大脑全方位的AI能力正在不断赋能百度输入法,输入法也在变得更聪明、更智能、更懂你的表达,未来的输入法将从手机端延伸到智能家居、车联网等更多场景,让人机交互更加高效自如。通过不断的技术创新和功能升级,百度输入法将为输入法行业提供更多AI创新样本,迎接5G时代的“提速”挑战,引领AI输入法全感官输入时代。

如果觉得《百度AI开发者大会输入法现场大飙Rap!高难度中英文混合语音识别惊艳全场》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。