[发明专利]语音模糊检索方法及装置有效
申请号: | 200910001164.5 | 申请日: | 2009-01-23 |
公开(公告)号: | CN101464896A | 公开(公告)日: | 2009-06-24 |
发明(设计)人: | 王智国;吴及;钱胜;吕萍;陈志刚;胡国平;胡郁;刘庆峰;吴晓如;王仁华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/00 |
代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
地址: | 230088安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 模糊 检索 方法 装置 | ||
1.一种语音模糊检索方法,其特征在于,包括:
利用预置的声学模型及语言模型对获取的语音信号进行语音识别,得到识别结果;
利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索,得到初选条目;
将所述初选条目与所述识别结果进行字符串模糊匹配,选取匹配度在预置的匹配度阈值范围内的精选条目,同时记录匹配位置;
计算精选条目匹配部分文本与所述语音信号间的后验概率,利用后验概率以及通过所述匹配位置获得的匹配比例选择若干个条目作为语音信号的检索结果。
2.根据权利要求1所述方法,其特征在于,所述索引表包括索引项以及索引项对应的内容,其中,所述索引项为字或词,所述索引项对应的内容是所述预置的文本条目库中包括该字或词对应的文本。
3.根据权利要求2所述方法,其特征在于,还包括:所述语言模型全部或部分利用所述预置的文本条目库训练得到。
4.根据权利要求1所述方法,其特征在于,所述利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索得到初选条目的具体过程为:
利用预置的索引表对识别结果中的每个字/词进行投票,选取投票数高于预置的投票数阈值的条目作为所述初选条目;
其中,所述投票是指用识别结果中的字/词查找索引表的索引项,查询到索引项后,将该索引所包括的每个条目投票数都加1。
5.根据权利要求1所述方法,其特征在于,所述模糊匹配的匹配算法采用基于混淆矩阵的文本间编辑距离动态规划计算方法,其中,所述混淆矩阵通过训练得到或者预先设定,对替换、插入、删除代价进行优化。
6.一种语音模糊检索装置,其特征在于,包括:
语音信号获取单元,用于获取语音信号;
识别单元,用于利用预置的声学模型及语言模型对获取的语音信号进行语音识别,得到识别结果;
检索单元,用于利用预置的索引表根据所述识别结果在预置的文本条目库中进行检索,得到初选条目;
模糊匹配单元,用于将所述初选条目与所述识别结果进行字符串模糊匹配,选取匹配度在预置的匹配度阈值范围内的精选条目,并记录匹配位置;
结果确定单元,用于计算精选条目的匹配部分与所述语音信号间的后验概率,利用后验概率以及通过所述匹配位置获得的匹配比例选择若干个条目作为语音信号的检索结果。
7.根据权利要求6所述装置,其特征在于,还包括:
索引表建立单元,用于建立所述索引表,所述索引表包括索引项以及索引项对应的内容,其中,所述索引项为字或词,所述索引项对应的内容是所述预置的文本条目库中包括该字或词对应的文本。
8.根据权利要求7所述装置,其特征在于,还包括:
语言模型建立单元,用于利用所述预置的文本条目库训练得到所述语言模型的部分或全部。
9.根据权利要求6、7或8所述装置,其特征在于,所述检索单元包括:
索引投票子单元,用于利用预置的索引表对识别结果中的每个字/词进行投票,其中,所述投票是指用识别结果中的字/词查找索引表的索引项,查询到索引项后,将该索引所包括的每个条目投票数都加1;
初选条目选取子单元,用于选取投票数高于预置的投票数阈值的条目作为所述初选条目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910001164.5/1.html,转载请声明来源钻瓜专利网。