[发明专利]一种语音中检测关键词的方法和装置有效

专利信息
申请号: 201310740533.9 申请日: 2013-12-27
公开(公告)号: CN103730115A 公开(公告)日: 2014-04-16
发明(设计)人: 李伟浩;苏鹏宇 申请(专利权)人: 北京捷成世纪科技股份有限公司
主分类号: G10L15/08 分类号: G10L15/08;G10L15/183
代理公司: 北京庆峰财智知识产权代理事务所(普通合伙) 11417 代理人: 刘元霞
地址: 100191 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 检测 关键词 方法 装置
【说明书】:

技术领域

发明涉及音频处理领域,尤其涉及一种语音中检测关键词的方法和装置。

背景技术

现有的检测方法中,主要分为基于补白模型及语音识别的检测方法;其中第一种方法无法自由地增添删改关键词,而第二种方法则对于局外词无法检测。

基于补白模型的语音关键词检测方法在进行关键词识别前需要事先定义好关键词和补白模型的搜索网络,检测速度快,但却没有利用语言模型的知识,当关键词发生改变时需要重新定义关键词和补白模型的搜索网络重新进行识别。而在新闻广播舆情信息检索任务中,待查询的关键词经常发生变化,因此不适合进行新闻广播的舆情信息检索。

基于词网格关键词检索方法,是通过语音识别解码技术产生词网格,其中网格中保留着识别过程中的多个侯选结果,特别适合与任务无关的关键词检测。但由于网格的结构复杂,存在比较多的冗余连接弧不利于数据处理和存储;因此关键词的漏检率比较大。

发明内容

本发明的实施例提供了一种语音中检测关键词的方法和装置,基于语音识别的基础上,识别出候选拼音,进而对关键词进行检测,能够很好地解决局外词的问题。

为达到上述目的,采用如下技术方案:

一种语音中检测关键词的方法,包括如下步骤:

对输入语音进行声学解码,根据声学编码对应的声学特征确定输入语音对应的候选词序列,并根据候选词序列和对应的回溯路径、匹配得分生成词候选网格;

将所述词候选网格进行拆分,形成以拼音为单位的候选字网格;

将所述字网格中的弧进行优化,并聚类为混淆网络;

根据混淆网络的格式,对每个拼音建立逆向索引;

将待检索关键词转换成目标拼音,并通过所述逆向索引定位所述待检索关键词中的每个目标拼音在混淆网络中的位置,根据混淆网络中各目标拼音的时序关系及对应的置信度判断所述待检索关键词是否出现在语音中。

进一步,所述根据声学编码对应的声学特征确定输入语音对应的候选词序列时,提取语音信号的线性感知预测参数,通过隐马尔可夫的声学模型及N-gram的语言模型,分别计算各线性感知预测参数在每个模型中的概率得分,利用维特比解码,搜索最优路径,得到输入语音对应的候选词序列。

进一步,所述利用维特比解码,搜索最优路径,得到输入语音对应的候选词序列具体为:根据贝叶斯决策准则,所述候选词序列为W^=w^1,w^2,...,w^N:]]>

W^=argmaxwP(W|Y)=argmaxwp(W)P(Y|W)P(Y)]]>

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷成世纪科技股份有限公司,未经北京捷成世纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310740533.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top