失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > 语音识别相关资料整理

语音识别相关资料整理

时间:2024-03-17 06:02:38

相关推荐

语音识别相关资料整理

目录

1.相关会议

2. 具体补充

1. MFCC相关:

3.附件

1.相关会议

1.1 国际最顶尖会议

ICASSP:声学,语音和信号处理国际会议每年一届,10月截稿,次年5月开会ICSLP:半导体激光与光子学国际会议偶数年举办,4月截稿,9月开会EuroSpeech :欧洲演讲会议沟通与技术奇数年举办,4月截稿,9月开会

1.2 其他会议

ICSMC:Int l系统,人与控制论会议NAECON:国家航空航天与电子会议ICTTA:电信技术与应用国际会议ISSPA:信息科学,信号处理及其应用ISPACS:智能信号处理与通信系统国际研讨会SBEC:南方生物医学工程会议ICAPR:模式识别进展国际会议ICOSP:信号处理会议国际会议ICSLP:国际口语处理会议ICICIC:创新计算,信息与控制国际会议IEMBS:电气和电子工程师协会NLPKE:自然语言处理和知识工程 ◆IECON:IEEE工业电子学会会议 ◆ICCT:国际清洁运输委员会 ◆ASRU:自动语音识别和理解 ◆ISCAS:国际电路与系统研讨会 ◆ISPACS:国际智能信号处理与通信系统 ◆研讨会ICDSP:数字信号处理国际会议 ◆SPAWC:无线通信中的信号处理进展 ◆ICCSIT:计算机科学与信息技术 ◆国际会议ICSE:软件工程国际会议ICIAS:智能和先进系统国际会议 ◆TENCON:技术环境咨询 ◆ICFCC:未来计算机和通信国际会议 ◆WCICA: 世界智能控制和自动化大会 ◆MMSP:多媒体信号处理国际研讨会 ◆IROS:智能机器人和系统 ◆ICSDA:国际合作 ◆自卫国际协会 ICCCE:计算机与通信工程国际会议 ◆其他的会议还有:ISPA,ASPAA,INDICO,NetCom等

1.3 期刊

国内 ◆ 声学学报 ◆应用声学 ◆声学工程 ◆信号处理 ◆电子学报国外: IEEE信号处理杂志(IF:2.655),一年6期,是双月刊) ◆计算机语音和语言(CSL)(IF:1.776) ◆数字信号处理(IF:0.889) ◆IEE Electronics Letters(IF:1.063) ◆IEEE信号处理快报(SPL)---(IF:0.722) ◆IEEE音频,语音和语言处理交易(IF:2.950) ◆IEEE电路与系统交易-II:Express Briefs(CAS-II)---(IF:0.922) ◆IEEE信号处理交易(TSP) - (IF:1.57) ◆IEEE电路与系统交易-I:普通论文(CAS-I)---(IF:1.139) ◆IET信号处理(IF:1.250) ◆信号处理(IF:0.669) ◆信号处理:图像通信(IF:1.109) ◆语音通信(IF:1.585)其中IF为影响因子

1.4 国际语音识别技术研究机构 ●

AT&T error ●ATR http://www.slt.atr.co.jp/index.html BBN /technology/speech_recognition/ ●剑桥大学工程系(CUED) http://mi.eng.cam.ac.uk/ ●卡内基梅隆大学(CMU) ●惠普实验室 http://www./ ●哥伦比亚大学●爱丁堡大学语音技术研究中心 ●ESAT - KULeuven的PSI演讲小组●国际计算机科学研究所(ICSI) ●IBM人类语言技术 http://www./hlt/●IDIAP研究所●INESC-ID Lisboa,口语系统实验室●IRST ●ISIP ●约翰斯·霍普金斯大学(CLSP) ●KTH的演讲,音乐和听力 ●LIMSI●阿尔卡特朗讯(贝尔实验室) http://www.alcatel-/wps/portal/BellLabs ●Microsoft /en-us/groups/speech/●麻省理工学院口语系统 ●俄勒冈大学研究生院(OGI)口语语言理解中心●罗格斯大学语音和语言处理实验室●亚琛工业大学 ●科罗拉多大学博尔德分校(CLEAR) ●谢菲尔德大学 ●SRI●东京工业大学福瑞实验室●伊利诺伊大学厄本那和香槟分校 ●华盛顿大学●埃尔兰根 - 纽伦堡大学●剑桥大学 http://htk.eng.cam.ac.uk/ ●CMU大学 http://www.speech.cs.cmu.edu/●张智星语音识别,机器学习 /jang/ ●科英文安徽大讯飞 /

1.5 国际语音识别技术评测 NIST语言技术评估基准测试

(http://www.nist.gov/speech/tests/index.htm)

1.6 语音识别技术工具包 ◆

AT&T FSM库 ◆CMU-Cambridge Statistical LM Toolkit ◆CMU Sphinx◆CSLU工具包 ◆CUED HTK ◆爱丁堡语音工具库 ◆KTH WaveSurfer ◆MSState ASR工具包NIST实用软件◆SPRACHcore软件包 ◆SRI语言建模工具包 ◆SoX - 声音交换 ◆转录器 ◆UCL语音文件系统 ◆FBVIEW多通道音频文件观众

1.7 语音识别网站及相关论坛

①/home/forums/message-boards/acoustic-model-discussions

③/

④http://www.ctiforum。 com / voice.html

⑤http://liceu.uab.es/~joaquim/phonetics/fon_anal_acus/herram_anal_acus.html

⑥http://www.phon.ucl.ac.uk/resource/scribe/

1.8主页和博客

1.bill夏的博客: http://ibillxia.github.io/blog/categories/assp/ 这个大神的博客有深度学习的一些东西,有用。

2.zouxy09的博客: /zouxy09/article/category/1218766 zouxy09大神对深度学习和机器学习都有研究,博客质量很高的

3.台湾张智星教授的主页: /jang/里面有一个语音课程:音频信号处理和识别

4.cmu大学的语音组: http://www.speech.cs.cmu.edu/ 里面有很多链接

5. dan ellis教授的主页: http://www.ee.columbia.edu/~dpwe/里面有很多工具箱

6.dan povey大神的主页: /index.html kaldi的资料很多

7.微软邓力老师的主页: /en-us/people/deng/关于深度学习的语音识别资料

8.王德江老师的主页: http://www.cse.ohio-state.edu/~dwang/pnl/software.html 关于语音识别语音分离,音乐分离

9.国外大神SnippyHolloW的github主页: /SnippyHolloW

10.自然语言处理的论坛: /portal.php 非常多的资源

1.9 语音识别与合成

●卡内基梅隆大学CMU语音组 http://fife.speech.cs.cmu.edu/

●约翰斯·霍普金斯大学语言与语音处理组 http://www.clsp.jhu.edu/

●国外比较全的一个语音技术研究的链接 http://mambo.ucsc.edu/psl/speech.html

●加州大学圣巴布拉分校的Allen Gersho教授所在的信号压缩实验室 http:// scl .ece.ucsb.edu / index.htm ●Rutgers大学CAPI中心下的语音识别组 http://www.caip.rutgers.edu/ARPA-SLT

●密歇根州立大学语音处理实验室Deller教授所领导的语音处理研究组 http://www.egr.msu.edu/~deller/speechlab_people.html

●普渡大学语言和语言处理研究组 http://wavelet.ecn.purdue.edu/~speechg

●日本名古屋工业大学的Keiichi TOKUDA教授,在基于参数的语音合成领域非常有名气的,他们开发的HTS平台目前的应用也非常广泛。 对于研究语音合成和语音识别的人会有帮助。地址如下: http://www.sp.nitech.ac.jp/ HTS的主页为:http: //hts.sp.nitech.ac.jp /

1.10 语音识别工具箱:

1.kaldi:/

2.htk:http://htk.eng.cam.ac.uk/

3.RWTH:http://www-i6.informatik.rwth-aachen.de/rwth-asr/

4.sphinx:/

5.julius:http://julius.sourceforge.jp/en_index.php

1.11 说话人识别:

1.微软的开源库MSR Identity Toolkit v1.0:/en-us/downloads/a6262fec-03a7-4060-a08c-0b0d037a3f5b/

2.王德江老师的主页也有说话人识别的资料:http://www.cse.ohio-state.edu/~dwang/pnl/software.html

2. 具体补充

1. MFCC相关:

/qq_28006327/article/details/59129110?utm_source=blogxgwz9

/zouxy09/article/details/9156785/

/s/blog_892508d501012px5.html

/wiki/Mel-frequency_cepstrum

/jojozhangju/article/details/18678861

3.附件

附件是计算机领域的学术会议等级排名情况,分为A+, A, B, C, L 共5个档次。其中A+属于顶级会议,基本是这个领域全世界大牛们参与和关注最多的会议。国内的研究者能在其中发表论文的话,是很值得骄傲的成就。

A类也是非常好的会议了,尤其是一些热门的研究方向,A类的会议投稿多录用率低,部分A类会议影响力逐步逼近A+类会议。B类的会议分两种,一种称为盛会级,参与的人多,发表的论文也多,论文录用难度比上两个级别要低很多,通常是行业内的学者们年度交流的好时机。一种是专业级的小会,圈子往往比较小,但是也有一些相对质量不错的成果发表。另外B类也是一个分水岭,是区分NB成果和普通成果的分界线,往下的C类会议知名度就低很多了,而L级的会议更多。如果不是为了注水,而是追求论文的质量多过数量的话,不建议在L级会议上发表论文。除此以外计算机还有更多的会议不在列表内,这些属于更不入流的会议了

参考:/lrt366/article/details/81349182

如果觉得《语音识别相关资料整理》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。