[发明专利]语音识别方法和系统有效

专利信息
申请号: 201210585431.X 申请日: 2012-12-28
公开(公告)号: CN103000176A 公开(公告)日: 2013-03-27
发明(设计)人: 何婷婷;胡郁;胡国平;刘庆峰 申请(专利权)人: 安徽科大讯飞信息科技股份有限公司
主分类号: G10L15/26 分类号: G10L15/26
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王宝筠
地址: 230088 安徽*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 识别 方法 系统
【权利要求书】:

1.一种语音识别方法,其特征在于,包括:

对用户输入的语音信号进行语音识别,获得第一最优解码路径,所述第一最优解码路径包括语音识别结果以及所述语音识别结果中各字符对应的语音片段;

接收用户单独输入的纠错信息并生成相应的纠错字符串,所述纠错信息通过非语音方式或语音方式输入;

获取所述纠错字符串在所述用户输入的语音信号中对应的至少一个语音段作为侯选语音段,并分别统计各侯选语音段在所述纠错字符串模型上的似然度;

根据所述语音识别结果中各字符对应的语音片段,分别确定上述各侯选语音段在第一最优解码路径的语音识别结果中所对应的字符串作为侯选字符串;

根据所述侯选语音段的似然度计算与之对应的侯选字符串的纠错置信度,并根据纠错置信度确定出错误字符串;

利用所述纠错字符串替换所述错误字符串。

2.如权利要求1所述的方法,其特征在于,所述根据所述侯选语音段对应的似然度计算与之对应的侯选字符串的纠错置信度包括:

在满足预设条件时,按照侯选字符串所对应侯选语音段的似然度从大到小的顺序,依次将侯选字符串设为当前考察对象;

在所述纠错字符串和当前考察对象相同时,将所述当前考察对象的纠错置信度设为第一预设值;

在所述纠错字符串和当前考察对象不相同,并且,当前考察对象为第一个侯选字符串时,将所述当前考察对象的纠错置信度设为第二预设值;

在所述纠错字符串和当前考察对象不相同,并且,当前考察对象不为第一个侯选字符串时,按照预设算法计算所述当前考察对象对应的纠错置信度。

3.如权利要求2所述的方法,其特征在于,所述预设条件包括存在尚未考察的侯选字符串,并且已考察的侯选字符串总数不大于预设的最大候选总数。

4.如权利要求3所述的方法,其特征在于,所述按照预设算法计算所述当前考察对象对应的纠错置信度具体包括:

当所述当前考察对象所对应语音段的似然度不大于第一预设阈值T时,将所述当前考察对象的纠错置信度设为所述第一预设值;

当所述当前考察对象所对应语音段的似然度大于所述T并且差值ΔS大于第二预设阈值时,将所述当前考察对象的纠错置信度设为所述第二预设值;

当所述当前考察对象所对应语音段的似然度大于所述T并且差值ΔS小于第二预设阈值时,将所述当前考察对象的纠错置信度设为所述第一预设值;

所述差值ΔS为当前考察对象所对应语音段的似然度与最大似然度之间的差值,所述最大似然度为所有侯选语音段所对应的似然度中的最大值。

5.如权利要求6所述的方法,其特征在于,所述根据纠错置信度确定出错误字符串具体包括:

将所有纠错置信度等于所述第二预设值的侯选字符串作为错误字符串。

6.如权利要求1所述的方法,其特征在于,所述根据所述纠错字符串确定所述用户输入的语音信号中侯选语音段,包括:

根据所述纠错字符串生成纠错字符串检索网络,所述纠错字符串检索网络包括所述纠错字符串对应的纠错字符串模型以及预置的吸收模型;

在所述纠错字符串检索网络内搜索相应于所述用户输入的语音信号的第二最优解码路径,所述第二最优解码路径包括所述纠错字符串模型对应的语音段作为所述侯选语音段;

确定所述侯选语音段在所述用户输入的语音信号中对应的起始位置和结束位置。

7.如权利要求6所述的方法,其特征在于,所述根据所述纠错字符串生成纠错字符串检索网络,包括:

获取所述纠错字符串对应的纠错字符串模型;

获取预置的吸收模型;

根据获取的纠错字符串模型以及吸收模型生成所述纠错字符串检索网络。

8.如权利要求1至7任一项所述的方法,其特征在于,所述利用所述纠错字符串替换所述错误字符串具体包括:

在所述错误字符串的数目等于1时,直接利用所述纠错字符串替换所述错误字符串;

在所述错误字符串的数目大于1时,利用所述纠错字符串替换用户指定的错误字符串。

9.如权利要求8所述的方法,其特征在于,所述利用所述纠错字符串替换用户指定的错误字符串具体包括:

在所述语音识别结果中突出显示所有错误字符串;

接受用户选择,利用所述纠错字符串更新用户选定的错误字符串。

10.一种语音识别系统,其特征在于,包括:

语音识别单元,用于对用户输入的语音信号进行语音识别,获得第一最优解码路径,所述第一最优解码路径包括语音识别结果以及所述语音识别结果中各字符对应的语音片段;

纠错字符串生成单元,用于接收用户单独输入的纠错信息并生成相应的纠错字符串,所述纠错信息通过非语音方式或语音方式输入;

自动纠错单元,用于根据所述纠错字符串确定所述用户输入的语音信号中侯选语音段;统计所述侯选语音段在所述纠错字符串模型上的似然度;根据所述语音识别结果中各字符对应的语音片段,确定上述侯选语音段在第一最优解码路径的语音识别结果中所对应的字符串作为侯选字符串;根据所述侯选语音段对应的似然度计算与之对应的侯选字符串的纠错置信度,并根据纠错置信度确定出错误字符串;利用所述纠错字符串替换所述错误字符串。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210585431.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top