[发明专利]一种语音中检测关键词的方法和装置有效

申请号：	201310740533.9	申请日：	2013-12-27
公开（公告）号：	CN103730115A	公开（公告）日：	2014-04-16
发明（设计）人：	李伟浩;苏鹏宇	申请（专利权）人：	北京捷成世纪科技股份有限公司
主分类号：	G10L15/08	分类号：	G10L15/08;G10L15/183
代理公司：	北京庆峰财智知识产权代理事务所(普通合伙) 11417	代理人：	刘元霞
地址：	100191 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音检测关键词方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及音频处理领域，尤其涉及一种语音中检测关键词的方法和装置。

背景技术

现有的检测方法中，主要分为基于补白模型及语音识别的检测方法；其中第一种方法无法自由地增添删改关键词，而第二种方法则对于局外词无法检测。

基于补白模型的语音关键词检测方法在进行关键词识别前需要事先定义好关键词和补白模型的搜索网络，检测速度快，但却没有利用语言模型的知识，当关键词发生改变时需要重新定义关键词和补白模型的搜索网络重新进行识别。而在新闻广播舆情信息检索任务中，待查询的关键词经常发生变化，因此不适合进行新闻广播的舆情信息检索。

基于词网格关键词检索方法，是通过语音识别解码技术产生词网格，其中网格中保留着识别过程中的多个侯选结果，特别适合与任务无关的关键词检测。但由于网格的结构复杂，存在比较多的冗余连接弧不利于数据处理和存储；因此关键词的漏检率比较大。

发明内容

本发明的实施例提供了一种语音中检测关键词的方法和装置，基于语音识别的基础上，识别出候选拼音，进而对关键词进行检测，能够很好地解决局外词的问题。

为达到上述目的，采用如下技术方案：

一种语音中检测关键词的方法，包括如下步骤：

对输入语音进行声学解码，根据声学编码对应的声学特征确定输入语音对应的候选词序列，并根据候选词序列和对应的回溯路径、匹配得分生成词候选网格；

将所述词候选网格进行拆分，形成以拼音为单位的候选字网格；

将所述字网格中的弧进行优化，并聚类为混淆网络；

根据混淆网络的格式，对每个拼音建立逆向索引；

将待检索关键词转换成目标拼音，并通过所述逆向索引定位所述待检索关键词中的每个目标拼音在混淆网络中的位置，根据混淆网络中各目标拼音的时序关系及对应的置信度判断所述待检索关键词是否出现在语音中。

进一步，所述根据声学编码对应的声学特征确定输入语音对应的候选词序列时，提取语音信号的线性感知预测参数，通过隐马尔可夫的声学模型及N-gram的语言模型，分别计算各线性感知预测参数在每个模型中的概率得分，利用维特比解码，搜索最优路径，得到输入语音对应的候选词序列。

进一步，所述利用维特比解码，搜索最优路径，得到输入语音对应的候选词序列具体为：根据贝叶斯决策准则，所述候选词序列为W^=w^1,w^2,...,w^N:]]>