[发明专利]基于中英文混合词典的语音识别方法及装置有效
申请号: | 201710317337.9 | 申请日: | 2017-05-04 |
公开(公告)号: | CN107195295B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 李先刚;张雪薇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/00 | 分类号: | G10L15/00;G10L15/06;G10L15/16;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于中英文混合词典的语音识别方法及装置,其中,方法包括:获取国际音标IPA标注的中英文混合词典,中英文混合词典包括:中文词典和经过中式英语修正的英文词典;将中英文混合词典作为训练词典,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以国际音标的状态为目标,以联结主义时间分类器CTC为训练准则对模型进行训练,得到训练后的CTC声学模型;结合训练后的CTC声学模型对中英文混合语言进行语音识别。本实施例中,采用包括中文词典和经过中式英语修正的英文词典的中英文混合词典进行训练,其中英文单词覆盖全面且能识别中式英文,结合CTC声学模型的使用进一步提高了中英文混合语言识别的准确度。 | ||
搜索关键词: | 基于 中英文 混合 词典 语音 识别 方法 装置 | ||
【主权项】:
一种基于中英文混合词典的语音识别方法,其特征在于,包括:获取国际音标IPA标注的中英文混合词典,所述中英文混合词典包括:中文词典和经过中式英语修正的英文词典;将所述中英文混合词典作为训练词典,以一层卷积神经网络CNN加上五层时间递归神经网络LSTM为模型,以国际音标的状态为目标,以联结主义时间分类器CTC为训练准则对所述模型进行训练,得到训练后的CTC声学模型;结合训练后的CTC声学模型对中英文混合语言进行语音识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710317337.9/,转载请声明来源钻瓜专利网。