[发明专利]一种对语音识别后文本进行检错并纠错的方法有效
申请号: | 200910092461.5 | 申请日: | 2009-09-08 |
公开(公告)号: | CN101655837A | 公开(公告)日: | 2010-02-24 |
发明(设计)人: | 李蕾;龙丽霞;王兴建;王骏 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G10L15/00 |
代理公司: | 北京德琦知识产权代理有限公司 | 代理人: | 谢安昆;宋志强 |
地址: | 100876*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 文本 进行 检错 纠错 方法 | ||
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种对语音识别后文本进行检错并纠错的方法。
背景技术
语音识别技术是一种让机器通过识别和理解,把人类的语言转变为相应的文本的技术,其最终目的是让机器“听懂”人类的语言,实现人类与机器的自由交流。然而,现有语音识别后文本中经常会有很多错误,也即语音识别率并不是很高,从而影响了人类与机器之间的正常交流,因此,提高语音识别率成了语音识别技术中的当务之急。
为了提高语音识别率,也就需要对语音识别后文本进行检错并纠错。
发明内容
有鉴于此,本发明提供了一种对语音识别后文本进行检错并纠错的方法,以提高语音识别率、实现人类与机器的自由交流。
为达到上述目的,本发明的技术方案具体是这样实现的:
一种对语音识别后文本进行检错并纠错的方法,用于对语音识别后文本中的文本句进行检错,并对检错后文本句中的错误词语进行纠错,包括:
按照所述语音识别后文本中的文本句所属领域,分别创建包含有N元语法值集合的第二语法知识库,包含有核心词集合的第二语义知识库,以及第二语境知识库,其中,第二语境知识库包含有核心词、由包含核心词的文本句形成的实例、以及所述核心词与其实例中除该核心词之外的其它词语的语境关联度集合;并且,所述第二语法知识库独立于包含有通用语法知识的第一语法知识库,所述第二语义知识库独立于包含有通用语义知识的第一语义知识库;
将所述语音识别后文本中的文本句转换成拼音形式的文本句,从所述第二语法知识库中获取所述拼音形式的文本句的N元语法值,将N元语法值大于阈值T1的N个拼音对应的词语和所述第二语义知识库中的核心词的并集作为所述语音识别后文本中的文本句的锚点词,其中,所述N为自然数;
查找所述第二语境知识库,获取每个锚点词对应的实例;基于第二语境知识库中的语境关联度和第一语义知识库中的语义相似度,计算所述语音识别后文本中的文本句中的每个词语与每个所述获取的实例中所有词语的词语相关度,并根据所述词语相关度计算所述获取的实例与所述语音识别后文本中的文本句的文本相关度,获取每个锚点词对应的实例中文本相关度最大的实例;
基于第二语境知识库中的语境关联度和第一语义知识库中的语义相似度,计算所述语音识别后文本中的文本句中的词语与所述获取的每个锚点词对应的实例中文本相关度最大的实例的词语相关度,如果所述词语相关度大于阈值T3,则将所述词语作为正确词语,将所述语音识别后文本中的文本句中正确词语以外的其它词语作为错误词语;
从第一语法知识库中获取候选词语,如果所述候选词语与所述获取的文本相关度最大的实例和谐,则使用所述候选词语替换所述错误词语,
其中,所述创建第二语义知识库包括:
搜索所述语音识别后文本中的文本句所属领域中的文本,并设定所述语音识别后文本中的文本句所属领域中的语境词为种子词库,分别计算所述搜索到的文本中的文本句与所述语境词共同出现在同一个文本句中的频数,将频数最高的前三位词语加入到种子词库中,得到新种子词库,
基于新种子词库对所述搜索到的文本进行卡方检验,将卡方检验后得到的所述搜索到的文本中每个词语的总卡方值大小进行排序,从所述排序后的词语中取出卡方值大于某一阈值的词语作为核心词,得到所述第二语义知识库,所述阈值的大小由所需选取的核心词数量来确定。
由上述的技术方案可见,本发明所采用的对语音识别后文本进行检错并纠错的方法,是分别对语音识别后文本中的每一个文本句进行检错、并对检错后的文本句中的错误词语进行纠错的。由于该方法中所采用的第二语法知识库、第二语义知识库和第二语境知识库都是针对所述语音识别后文本中的文本句所属领域创建的,而且通过上述创建的特定领域的第二语法知识库和第二语义知识库来获取锚点词,也就使得获取的锚点词是特定领域下的,并通过该特定领域下的锚点词来获取实例,进一步地,通过实例来计算其与所述语音识别后文本中中的文本句的文本相关度,也就使得在对文本句进行检错纠错时充分结合了文本句所属领域下的语法、语义以及语境知识,能够对语音识别后文本进行准确的检错并纠错,从而提高语音识别率、实现人类与机器的自由交流。
附图说明
图1为本发明对语音识别后文本进行检错并纠错的工作流程图。
图2为本实施例所采用的第二语法知识库的创建方法的工作流程图。
图3为本实施例所采用的第二语义知识库的创建方法的工作流程图。
图4为本发明采用第二语法知识库定位锚点词的工作流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910092461.5/2.html,转载请声明来源钻瓜专利网。