失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 使用讯飞语音实现语音识别 朗读文字

使用讯飞语音实现语音识别 朗读文字

时间:2022-09-11 13:28:24

相关推荐

使用讯飞语音实现语音识别 朗读文字

一.走近讯飞(iFly)

语音技术实现了人机语音交互,使人与机器之间沟通变得像人与人沟通一样简单。语音技术主要包括语音合成和语音识别两项关键技术。让机器说话,用的是语音合成技术;让机器听懂人说话,用的是语音识别技术。此外,语音技术还包括语音编码、音色转换、口语评测、语音消噪和增强等技术,有着广阔应用空间。

早期的语音识别技术让人啼笑皆非, 就连Siri刚出道时, 也是漏洞百出. 但是讯飞通过多年的不懈努力, 最近发展迅速, 这也是技术型项目前期技术积累的必然结果.百度也推出了自己的语音识别, 但是因为技术积累尚浅, 移植和测试体验尚不如讯飞 – 本条个人观点.

科大讯飞从开始的只做语音识别和语音合成, 到现在的广告+统计+广场+人脸识别+声纹识别+推送, 可以看出它的野心–打造综合性平台, 同时又不放弃专营业务(并且拥有难以记忆的英文缩写和logo).

从使用讯飞的SDK过程中, 还是能感觉到诚意的, 很多设计很人性化, 免费提供了诸多测试和使用接口, 让人好感倍增, 这也是为啥我为其做了这么多广告.

二.搭建环境

登录开发者平台
注册用户并且登录

创建新应用

选择创建新应用:

file-list

这里可以比较随意填写, 但是注意平台别搞错.

file-list

应用创建好之后, 请记录下讯飞为该APP生成的Appid: 56678310 (每个人都不一样哦)

为新应添加服务

新创建的应用可以在”我的应用”中查看, 开始的时候, 这个应用没有使用任何SDK, 我们需要向讯飞注册一下我们的app都需要哪些服务.

file-list

点击”开通更多服务”, 选择语言听写和在线语音合成两个SDK, 第一个开发语义是自己添加上的.

file-list

下载相应SDK

进入下载SDK界面, 您可以通过诸多位置进入到这里, 可能与截图不符, 但没有问题.

file-list

这里选择”组合服务SDK下载”, 勾选图中前两个.

file-list

选择平台

file-list

最后选择刚才创建的引用, 之后点击下载.

file-list

新建xcode(singleView)工程, 将下载好的文件夹中lib下的iflyMac导入(拖入)工程

添加引用库

file-list

三.代码+++++

在storyBoard的viewController中拖入几个控件, 一个UILable用来显示语音翻译后的文字, 两个UIbutton用来触发”带界面的实时翻译”和”不带界面的实时翻译”. 并为他们拖出属性和响应方法.

如图:

file-list

appdelegate.m中, 添加如下代码(注册):

AppDelegate.m 的 didFinishLaunchingWithOptions中:

下面是写好后的ViewController代码:

在上面的代码中, 使用了两个类:

他们的功能已经在注释中说明, 那么这两个类的源文件怎办呢… 让我想想…

算了, 最后我把这个工程传到git上吧. 你们从哪里扒下来就好了.

四.语音合成

其实iOS自带语音合成, 我们不必使用讯飞也可以达到这样的效果, 下面的代码能让你的APP读出这些文字.

Appdelegate.m中, 添加一个延展, 并且 didFinishLaunchingWithOptions 中添加如下代码:

运行之后, app能读出”啪啪啪”. 女性发音效果更好.

使用讯飞实现啪啪啪的功能

我们直接在上面的工程里添加吧.

首先在sb中的viewcontroller里, 再拖一个textfiled, 我们让讯飞朗读textfiled中的内容.

file-list

viewController.m, 这个将三个功能写到了同一个controller中.比较臃肿, 你们自己捋顺一下, 封装成类, 供以后使用.

如果觉得《使用讯飞语音实现语音识别 朗读文字》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。