[发明专利]语音辨识系统的词汇数据库建置方法及其搜寻比对方法无效
申请号: | 200710185709.3 | 申请日: | 2007-12-29 |
公开(公告)号: | CN101217035A | 公开(公告)日: | 2008-07-09 |
发明(设计)人: | 廖崇伯;陈淮琰 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/06;G06F17/30 |
代理公司: | 西安智邦专利商标代理有限公司 | 代理人: | 商宇科 |
地址: | 710075陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 辨识 系统 词汇 数据库 建置 方法 及其 搜寻 | ||
1.一种语音辨识系统的词汇数据库的建置方法,其特征在于:该方法包含以下步骤:
1)、提供多音字数据:多音字数据包含复数个多音字及其发音方式;
2)、输入词汇;
3)、建立声学模型:将词汇和多音字数据进行比对,判断此词汇是否包含至少一个多音字,若是,则对于此词汇所包含的多音字的复数个发音方式分别建立相对应的复数个声学模型,若否,则对于此词汇建立单一对应的声学模型;
4)、储存此词汇及其对应的声学模型至词汇数据库。
2.根据权利要求1所述的语音辨识系统的词汇数据库的建置方法,其特征在于:所述声学模型是隐藏式马可夫模型。
3.一种利用权利要求1所述的语音辨识系统的词汇数据库的搜寻比对方法,其特征在于:其包括以下步骤:
1)、提供一词汇数据库:该词汇数据库包含复数个词汇,并且将其中前缀相同的词汇以相邻的方式进行排序,而且这些词汇是以一对一的方式对应于复数个声学模型;
2)、输入语音讯号;
3)、获取语音讯号的特征参数:其中特征参数是梅尔倒频谱系数;
4)、将步骤3)获取的特征参数与这些词汇的声学模型逐一比对:声学模型是对应于特征参数分别产生的机率值,其中,每一词汇是继承前一相邻词汇中相同发音字符所产生的机率值;
5)、通过这些词汇的机率值进行语音讯号的辨识。
4.根据权利要求3所述的语音辨识系统的词汇数据库搜寻比对方法,其特征在于:所述声学模型是隐藏式马可夫模型。
5.根据权利要求3所述的语音辨识系统的词汇数据库搜寻比对方法,其特征在于:所述机率值是利用维特比算法计算产生的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710185709.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:铝合金材料表面仿不锈钢处理工艺
- 下一篇:一种钢材冶炼及成型系统及方法