[发明专利]汉语语音识别中重复出现词识别错误的自动修正方法有效

申请号：	201110220842.4	申请日：	2011-08-03
公开（公告）号：	CN102324233A	公开（公告）日：	2012-01-18
发明（设计）人：	李新辉;王向东;钱跃良;林守勋	申请（专利权）人：	中国科学院计算技术研究所
主分类号：	G10L15/26	分类号：	G10L15/26;G06F17/30
代理公司：	北京泛华伟业知识产权代理有限公司 11280	代理人：	王勇
地址：	100190 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法，包括：(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配，以查找重复出现词组；其中，字混淆网络是所有可能识别结果的集合，字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果；词组库包括词组及其对应的中间识别结果；(2)根据查找得到的词组信息，重新计算相似概率值和字识别概率值；(3)根据新的概率值，对字混淆网络按照概率值大小排序；和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。优点在于：利用之前已修正的识别结果中的经验知识，自动修正当前识别语句中重复出现词的识别错误，从而提高识别错误的修正效率，加快识别错误修正速度。
搜索关键词：	汉语语音识别重复出现错误自动修正方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种汉语语音识别中重复出现词识别错误的自动修正方法，其特征在于，包括：(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配，以查找重复出现词组；其中，字混淆网络是所有可能识别结果的集合，字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果；词组库包括词组及其对应的中间识别结果；(2)根据查找得到的词组信息，重新计算相似概率值和字识别概率值；(3)根据新的概率值，对字混淆网络按照概率值大小排序；和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所，未经中国科学院计算技术研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110220842.4/，转载请声明来源钻瓜专利网。

上一篇：对象调整方法、迁移控制设备、节点设备及存储系统
下一篇：传感器机构体及使用该传感器机构体的电子秤

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]汉语语音识别中重复出现词识别错误的自动修正方法有效

专利文献下载