[发明专利]语音模糊检索方法及装置有效
申请号: | 200910001164.5 | 申请日: | 2009-01-23 |
公开(公告)号: | CN101464896A | 公开(公告)日: | 2009-06-24 |
发明(设计)人: | 王智国;吴及;钱胜;吕萍;陈志刚;胡国平;胡郁;刘庆峰;吴晓如;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/00 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 230088安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 模糊 检索 方法 装置 | ||
技术领域
本发明涉及语音识别领域和检索领域,尤其涉及一种语音模糊检索方法及装置。
背景技术
语音模糊检索作为多媒体检索技术中的一个分支,与传统的文本检索和音频检索不同,它解决的不是文本之于文本库的检索或音频之于音频库的检索,而是音频之于文本库的检索,即如何根据用户提交的一段语音信号,在文本库中检索出与之内容相关的文本信息。
语音识别技术可以将语音信号转换为文字内容,若利用转换后的文字并借鉴文本检索方法,便可实现音频之于文本库的检索,然而,语音识别技术不能做到百分之百准确,特别是对于口语语音,识别准确率通常低于90%,可以想象,用非准确的文本来检索海量文本条目库,检索结果是更加不准确的。
发明内容
本发明提供一种语音模糊检索方法及装置,以解决现有语音识别技术存在的检索不准确的问题。
为此,本发明实施例采用如下技术方案:
一种语音模糊检索方法,包括:
利用预置的声学模型及语言模型对获取的语音信号进行语音识别,得到识别结果;
利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索,得到初选条目;
将所述初选条目与所述识别结果进行字符串模糊匹配,选取匹配度在预置的匹配度阈值范围内的精选条目,同时记录匹配位置;
计算精选条目匹配部分文本与所述语音信号间的后验概率,利用后验概率以及通过所述匹配位置获得的匹配比例选择若干个条目作为语音信号的检索结果。
该方法还包括:
根据待检索的文本条目以音节、字或词为索引单元建立所述索引表,用以进行一级或多级索引。
该方法还包括:
所述语言模型全部或部分利用所述预置的文本条目库训练得到。
其中:
所述识别结果的形式包括语音信号对应的最可能文字串、语音信号对应的最有可能的多种文字串,以及语音信号对应的词图。
所述利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索得到初选条目的具体过程为:
利用预置的索引表对识别结果中的每个字/词进行投票,选取投票数高于预置的投票数阈值的条目作为所述初选条目;
其中,所述投票是指用识别结果中的字/词查找索引表的索引项,查询到索引项后,将该索引所包括的每个条目投票数都加1。
所述模糊匹配的匹配算法采用基于混淆矩阵的文本间编辑距离动态规划计算方法,其中,所述混淆矩阵通过训练得到或者预先设定,对替换、插入、删除代价进行优化。
一种语音模糊检索装置,包括:
语音信号获取单元,用于获取语音信号;
识别单元,用于利用预置的声学模型及语言模型对获取的语音信号进行语音识别,得到识别结果;
检索单元,用于利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索,得到初选条目;
模糊匹配单元,用于将所述初选条目与所述识别结果进行字符串模糊匹配,选取匹配度在预置的匹配度阈值范围内的精选条目,并记录匹配位置;
结果确定单元,用于计算精选条目的匹配部分与所述语音信号间的后验概率,利用后验概率以及通过所述匹配位置获得的匹配比例选择若干个条目作为语音信号的检索结果。
该装置还包括:
索引表建立单元,用于根据待检索的预置的文本条目库以音节、字或词为索引单元建立所述索引表,所述索引表用以进行一级或多级索引。
该装置还包括:
语言模型建立单元,用于利用所述预置的文本条目库训练得到所述语言模型的部分或全部。
所述检索单元包括:
索引投票子单元,用于利用预置的索引表对识别结果中的每个字/词进行投票,其中,所述投票是指用识别结果中的字/词查找索引表的索引项,查询倒索引项后,将该索引所包括的每个条目投票数都加1;
初选条目选取子单元,用于选取投票数高于预置的投票数阈值的条目作为所述初选条目。
可见,本发明提出了一种全新的语音模糊检索模式,它通过应用相关的语言模型、索引投票、字符串模糊匹配、精选条目与语音信号的后验概率计算等步骤,克服了不完全正确的语音识别结果对文本库检索的不利影响,实现了语音信号在海量文本条目库上的快速准确检索。
附图说明
图1为本发明语音模糊检索方法流程图;
图2为本发明方法实施例流程图;
图3为本发明语音模糊检索装置结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910001164.5/2.html,转载请声明来源钻瓜专利网。