[发明专利]一种针对地区语言使用偏好的语音识别优化系统及其方法无效
申请号: | 200810029904.1 | 申请日: | 2008-07-31 |
公开(公告)号: | CN101329868A | 公开(公告)日: | 2008-12-24 |
发明(设计)人: | 陈铮陶;林超 | 申请(专利权)人: | 林超 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/22 |
代理公司: | 广州市华学知识产权代理有限公司 | 代理人: | 李卫东 |
地址: | 510640广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 地区 语言 使用 偏好 语音 识别 优化 系统 及其 方法 | ||
1.针对地区语言使用偏好的语音识别优化系统,其特征在于:包括词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块、电话语音识别系统,所述词汇表创建归类模块、语法模型初始化模块、词汇数据库、语法权重计算与语法模型生成模块、词汇使用记录模块设置在计算机内;所述词汇表创建归类模块、语法模型初始化模块、电话语音识别系统、词汇使用记录模块、词汇数据库、语法权重计算与语法模型生成模块依次连接,且所述电话语音识别系统通过PSTN或者Internet与语音输入输出设备连接;所述电话语音识别系统包括依次连接的IVR应用模块、自动语音识别模块、语法包模块,自动语音识别模块与所述词汇使用记录模块连接,语法包模块与所述语法模型初始化模块连接,IVR应用模块通过PSTN或者Internet与语音输入输出设备连接;
所述词汇表创建归类模块用于根据语音识别的归类条件,将词汇选项归入各个词汇分类中,建立词汇表数据库;
所述语法模型初始化模块用于根据所述词汇表数据库中的词汇分类及词汇选项的相应数据,为每个省区的每一个词汇分类相应生成一个电话语音识别系统的语法包;
所述电话语音识别系统的IVR应用模块用于根据用户呼入电话的号码判断出该号码所属的省区的信息,并连同用户所应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别系统的自动语音识别模块,自动语音识别模块将根据省区的信息和词汇分类的信息调用相对应语法包,对电话的语音信息进行自动识别;当语法包中的某一词汇选项被成功识别后,自动语音识别模块将识别成功的词汇选项的信息推送到词汇使用记录模块;
所述词汇使用记录模块用于在词汇数据库中增加一条词汇使用的记录,同时把省区以及该词汇选项所属的分类的信息写入该记录相应的字段中;
所述语法权重计算与语法模型生成模块用于以省区为单位对词汇数据库的记录进行统计,计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比,根据这个百分比来计算出词汇选项的权重系数,并最终将带权重系数的词汇选项更新到各自的语法包中。
2.根据权利要求1所述针对地区语言使用偏好的语音识别优化系统,其特征在于:所述语音输入输出设备包括固定电话、移动电话、IP电话。
3.用于权利要求1-2任一项所述针对地区语言使用偏好的语音识别优化系统的语音识别优化方法,其特征在于包括以下步骤:
(1)词汇表创建归类模块根据语音识别的归类条件,将词汇选项归入各个词汇分类中,建立词汇表数据库;
(2)语法模型初始化模块根据所述词汇表数据库中的词汇分类及词汇选项的相应数据,为每个省区的每一个词汇分类相应生成一个电话语音识别系统的语法包,所述语法包里包含着归属于此词汇分类的所有词汇选项;
(3)当用户使用电话语音识别系统时,电话语音识别系统的IVR应用模块根据用户呼入电话的号码判断出该号码所属的省区的信息,并连同用户所应答的语音信息、当前IVR节点所属的词汇分类信息一起推送到电话语音识别系统的自动语音识别模块,自动语音识别模块将根据省区的信息和词汇分类的信息调用相对应语法包,对电话的语音信息进行自动识别;
(4)当语法包中的某一词汇选项被成功识别后,自动语音识别模块将识别成功的词汇选项的信息推送到词汇使用记录模块,通过词汇使用记录模块在词汇数据库中增加一条词汇使用的记录,同时把省区以及该词汇选项所属的分类的信息写入该记录相应的字段中;
(5)语法权重计算与语法模型生成模块以省区为单位对词汇数据库的记录进行统计,计算出每个分类中各词汇选项在各自所属的分类中使用频率百分比,根据这个百分比来计算出词汇选项的权重系数,并最终将带权重系数的词汇选项更新到各自的语法包中;
(6)当用户再次使用该电话语音识别系统时,自动语音识别模块将根据省区的信息和词汇分类的信息调取调整了权重参数的语法包,用户将可获得准确率更高的语音识别的效果,从而实现针对地区语言使用偏好的语音识别优化过程。
4.根据权利要求3所述的语音识别优化方法,其特征在于:所述步骤(1)中,所述归类条件是指:根据系统的实际应用,人为地设定词汇的分类,然后再加入省区分类,以此作为语音识别的两个归类条件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林超,未经林超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810029904.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:汽车玻璃升降器开关
- 下一篇:快速制备SiC纳米线的方法