[发明专利]一种语音识别方法和装置有效
申请号: | 201310231499.2 | 申请日: | 2013-06-09 |
公开(公告)号: | CN103337241A | 公开(公告)日: | 2013-10-02 |
发明(设计)人: | 苏牧;李鹏;李轶杰;梁家恩 | 申请(专利权)人: | 北京云知声信息技术有限公司 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100083 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种语音识别方法和装置,接收输入的语音片段;根据子空间分布聚类SDC计算所述语音片段每一帧的多个声学得分;将得到的所述多个声学得分和移动终端词汇库中的词汇进行比对并累加每一帧比对后的声学得分,其中总分最高的为最优声学总分;所述语音片段每一帧的最高声学得分之和为背景声学总分;比对最优和背景声学总分是否满足预订阈值;如果否,则拒识所述语音片段,可以看出,将输入的语音片段的每一帧的最高声学得分之和,与输入的语音片段和移动终端词汇库中的词汇比较得出的最高声学总分比较后差值较大的判定为错误的语音输入并进行拒识,由此大大降低移动终端根据语音输入做出误操作的频率,提高了用户的体验度。 | ||
搜索关键词: | 一种 语音 识别 方法 装置 | ||
【主权项】:
一种语音识别方法,应用于移动终端,其特征在于,包括: 接收输入的语音片段; 根据子空间分布聚类SDC计算所述语音片段每一帧的多个声学得分; 根据所述声音片段的输入长度,以帧为单位,将得到的所述多个声学得分和移动终端词汇库中的n个词汇进行比对并累加每一帧比对后的声学得分,得到n个声学总分,n为大于等于1的整数,其中总分最高的设定为所述语音片段的最优声学总分; 计算在输入长度内的所述语音片段每一帧的最高声学得分之和,得到背景声学总分; 比对最优声学总分和背景声学总分是否满足预订阈值; 如果是,则确定所述语音片段为最优声学得分所对应的词汇; 如果否,则确定所述语音片段为错误的输入,拒识所述语音片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京云知声信息技术有限公司,未经北京云知声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310231499.2/,转载请声明来源钻瓜专利网。
- 上一篇:LED供电电路
- 下一篇:介入诊疗床边活动隔离墙装置