[发明专利]用于识别语音的系统和方法有效
申请号: | 201480033420.8 | 申请日: | 2014-05-19 |
公开(公告)号: | CN105283914B | 公开(公告)日: | 2018-12-28 |
发明(设计)人: | B·哈尔沙姆;J·R·赫尔歇 | 申请(专利权)人: | 三菱电机株式会社 |
主分类号: | G10L15/183 | 分类号: | G10L15/183;G10L15/22;G10L15/08 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 吕俊刚 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 组分数 方法识别 声学模型 语言模型 词序列 响应 更新 | ||
1.一种用于识别语音的方法,所述语音包括词的序列,该方法包括:
利用声学模型和语言模型来生成所述语音的一组解释;
针对每一个解释,确定在表达所述词的序列时表示解释的正确性的分数,以生成一组分数;
确定用于识别经受词序列约束的所述语音的约束;
确定指示与所述词序列约束的一致性的程度的约束因子;
基于所述约束因子来确定受约束的评分函数以更新所述一组分数;
利用所述评分函数来更新所述一组分数;以及
根据更新的一组分数,从所述一组解释中选择最佳解释作为识别的语音,其中,所述方法的步骤由处理器执行。
2.根据权利要求1所述的方法,其中,所述词序列约束包括所述词的序列中的词的数量、特定的词或特定的词的序列的存在或不存在、说出所述特定的词的时间、所述词的序列中的至少两个特定的词的顺序、所述词的序列中的两个特定的词的连接或分离、所述语音输入的主题中的一个或组合。
3.根据权利要求1所述的方法,其中,确定所述约束的步骤包括:
向用户传送所述一组解释的子集;
接收响应于所述传送的所述词序列约束;
基于所述词序列约束来确定所述约束的类型;以及
基于所述类型来确定所述约束。
4.根据权利要求3所述的方法,其中,所述类型是语言类型,并且确定所述约束的步骤包括:
基于所述词序列约束来更新所述语言模型。
5.根据权利要求4所述的方法,其中,所述词序列约束是所述语音的主题。
6.根据权利要求3所述的方法,其中,所述类型是声学类型,并且确定所述约束的步骤包括:
基于所述词序列约束来更新所述声学模型。
7.根据权利要求6所述的方法,其中,所述声学模型包括所述语音中的词与所述声学模型中的声学特征之间的对准。
8.根据权利要求7所述的方法,所述约束包括在特定时间区内仅存在一个词。
9.根据权利要求3所述的方法,其中,所述类型是上下文类型,并且确定所述约束的步骤包括:
确定测试每一个解释中存在或不存在特定的词的评分函数。
10.根据权利要求9所述的方法,其中,所述评分函数测试所述特定的词的存在,所述方法还包括:
基于所述语言模型来确定所述语音的方向;以及
根据所述语音的方向,利用针对所述特定的词之前和之后的词的存在的测试来更新所述评分函数。
11.根据权利要求1所述的方法,其中,所述评分函数S′(W|X)为
其中,∝指示比例,是所述解释中的N个词的序列w1,w2,...,wN,而wi是在位置i假设的词,指示所述声学模型的声学特征,其中,xj是所述语音输入的所述声学特征的第j个矢量,而T是声学特征矢量的数量,函数p(.|..)是概率,是一组可能的对准,是所述语音的针对每一个假设的词的假设时间区的集合,使得ri是针对词wi假设的位置,并且f(X,W,R)是针对声音序列、词序列以及对准中的一个或更多个输出指示与所述约束的一致性的程度的数值的约束因子。
12.根据权利要求11所述的方法,所述方法还包括:
利用所述词序列约束来确定指标函数;以及
确定所述约束因子作为具有确定约束满足程度的权重参数的所述指标函数的线性函数。
13.根据权利要求1所述的方法,其中,所述约束包括所述词的序列的元数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社,未经三菱电机株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201480033420.8/1.html,转载请声明来源钻瓜专利网。