[发明专利]使用成对比较进行重复语音查询中的超发音检测以改进语音识别有效
申请号: | 201880015606.9 | 申请日: | 2018-02-27 |
公开(公告)号: | CN110431626B | 公开(公告)日: | 2023-08-25 |
发明(设计)人: | R·古鲁纳特库尔卡尼;A·M·扈利;Z·A·阿瓦卜;N·阿龙;I·齐图尼 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L15/20 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 赵腾飞 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 自动语音识别系统可以受益于用户语音中的提示,比如超发声。传统方法通常尝试定义和检测超发声的绝对状态,但这是非常困难的,尤其是对于短语音查询。本公开内容提供了一种使用成对比较和在真实世界语音识别系统上进行超发声检测的方法。所公开的方法使用从一对重复的用户话音中提取的增量特征。由所公开的系统和方法提供的改进包括:通过使用超发声信息作为第二遍N最佳假设重新评分设置中的特征,来改善词错误率。 | ||
搜索关键词: | 使用 成对 比较 进行 重复 语音 查询 中的 发音 检测 改进 识别 | ||
【主权项】:
1.一种用于检测重复语音查询中的超发声的系统,所述系统包括:存储计算机可执行指令的机器可读存储器;以及与所述机器可读存储器通信的一个或多个硬件处理器,其执行所述计算机可执行指令,将所述系统配置为:接收包括至少一个词的第一音频话音;接收包括至少一个词的第二音频话音;基于所述第一音频话音与所述第二音频话音的比较,确定所述第二音频话音是否可能包括超发声;响应于确定所述第二音频话音可能包括超发声,确定多个超发声特征,至少一个超发声特征包括所述第二音频话音的一部分包括超发声的概率;确定与所述第二音频话音相对应的第一多个候选假设;基于所确定的多个超发声特征来确定所述候选假设中的每个候选假设的得分,其中每个候选假设与对应于所确定的得分的排名相关联;以及基于与所选择的假设相关联的所述排名,从所述第一多个假设中选择假设。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201880015606.9/,转载请声明来源钻瓜专利网。