[发明专利]语音识别方法、语音评分方法、语音识别系统及语音评分系统有效
申请号: | 201410438639.8 | 申请日: | 2014-08-29 |
公开(公告)号: | CN105374356B | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 叶树灵;程钧杰;姚俊杰;陈剑 | 申请(专利权)人: | 株式会社理光 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06;G10L15/08;G10L25/51 |
代理公司: | 上海市华诚律师事务所 31210 | 代理人: | 肖华 |
地址: | 日本东京都大*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 评分 系统 | ||
1.一种语音识别方法,用于对用户的语音进行识别,生成语音识别结果,其特征在于,包括以下步骤:
语音获取步骤,获取所述用户的所述语音;
语音识别步骤,通过语言识别处理将获取的所述语音转换为文本数据,作为初始语音识别结果;
纠错步骤,查阅已记录有若干个原词汇-偏差词汇的关联的纠错列表,若所述纠错列表的某一个原词汇-偏差词汇的关联中的偏差词汇存在于所述初始语音识别结果中,则进行纠错处理,以将所述初始语音识别结果中的与所述偏差词汇相同的词汇替换为所述原词汇-偏差词汇的关联中的原词汇,从而获得纠错后的语音识别结果,作为所述语音识别方法生成的语音识别结果。
2.如权利要求1所述的语音识别方法,其特征在于,
在执行所述纠错步骤之前执行生成纠错列表的步骤,在所述生成纠错列表的步骤中,包括:
样本采集步骤,指定不同于所述用户的多个读音标准的真人作为样本,获取每个样本朗读特定的原文所发生的样本语音,所述原文与所述语音执行方法的应用环境相对应;
样本语音识别步骤,将所述样本语音识别为样本文本数据,作为所述多个样本的样本语音识别结果;
概率计算步骤,在所述概率计算步骤中,通过对比所述原文和所述样本语音识别结果,
如果每个样本的语音识别结果与原文完全相同,不对目前所使用的纠错列表作改动;
如果所有样本的语音识别结果中存在与所述原文的不一致,从所述样本语音识别结果和所述原文中建立M个原词汇-偏差词汇的关联,从所有的所述M个原词汇-偏差词汇的关联中找出对应同一原词汇的N个原词汇-偏差词汇的关联,统计所述原词汇-偏差词汇的关联中对应相同偏差词汇的关联的个数L,将对应同一原词汇的原词汇-偏差词汇的关联中具有相同偏差词汇的关联的个数除以对应同一原词汇的原词汇-偏差词汇的关联的个数计算得到对应同一原词汇的原词汇-偏差词汇的关联中具有相同偏差词汇的关联的概率L/N,其中M≥1、1≤N≤M、1≤L≤N;
大概率的原词汇-偏差词汇的关联选定步骤,基于所述概率计算步骤中得到的各个原词汇-偏差词汇的关联的所述概率,将所述概率大于等于第一阈值的原词汇-偏差词汇的关联作为大概率原词汇-偏差词汇的关联;
纠错列表更改步骤,将所述大概率原词汇-偏差词汇的关联收录进所述目前使用的纠错列表中,以生成新的纠错列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社理光,未经株式会社理光许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410438639.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种链条死节检测装置
- 下一篇:泡沫检漏装置