科大讯飞离线语音听写与合成
本文提供的仅为功能包已经有了的情况下,直接调用的方法。
(1)需要到科大讯飞网站注册帐号,拥有属于自己的appid,但好像现在科大讯飞的一个appid可以三个人一起使用。创建应用,下载 linux 版本 SDK 库文件。
(2)安装语音库,命令如下:
$ sudo apt-get update
$ sudo apt-get install libasound2-dev
(3)安装 mpalyer 播放器,命令如下:
$ sudo apt-get install mplayer
(4)安装 yaml_cpp(用途是对识别到的内容分类,某些电脑可能无法使用,若无法安装,
可将.cpp 中的相关代码删去)
(5)将已经做好的功能包复制到自己的工作空间:
修改 CMakelist.txt 中所有的地址为自己的地址;
找到和.cpp 文件中查找 appid ,将appid替换为你自己申请的 appid,同时修改各文件对
应的地址;
同时将 lib文件夹中的libmsc.so文件 更换为自己下载 sdk 里面的 libmsc.so,将功能包中的
bin 文件夹替换为 sdk 中的 bin 文件夹。
(6)编译
回到 catkin_ws 目录
$ catkin_make
我在编译时报了一个invoking f8_l8的错误,百度了一下也没发现是怎么回事,后来发现,是cmakelists里面的路径没改完。所以出现这种问题一般去cmakelists里面可以找到原因。然后就编译成功啦。
(7)调试运行
运行三个终端
第一个终端 运行主节点(相当于打开一个主控)
$ roscore
第二个终端 运行
如果是launch文件,直接rosrun就好了,但如果是服务端和客户端的话就要分开rosrun。
最后的话,我是可以运行啦,但识别正确率还有点欠缺,接下来小白就是去优化代码啦。
如果觉得《科大讯飞离线语音听写与合成》对你有帮助,请点赞、收藏,并留下你的观点哦!