[发明专利]关键词检索方法、系统、移动终端及存储介质有效

申请号：	202010239637.1	申请日：	2020-03-30
公开（公告）号：	CN111462777B	公开（公告）日：	2023-02-14
发明（设计）人：	张广学;肖龙源;李稀敏;刘晓葳;叶志坚	申请（专利权）人：	厦门快商通科技股份有限公司
主分类号：	G10L25/54	分类号：	G10L25/54;G10L25/03;G10L25/45;G06F16/9032
代理公司：	厦门仕诚联合知识产权代理事务所(普通合伙) 35227	代理人：	吴圳添
地址：	361009 福建省厦门市***	国省代码：	福建;35
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	关键词检索方法系统移动终端存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种关键词检索方法、系统、移动终端及存储介质，该方法包括：获取指定关键词库中每个指定关键词的指定声学状态和指定音素状态；根据指定声学状态对滑窗的窗长进行设置，获取待检测语音的当前声学状态，将滑窗设置为当前声学状态；根据滑窗判断待检测语音中语音段的声学状态与指定声学状态是否匹配；若是，则对语音段进行音素状态转换，得到当前音素状态；根据指定音素状态判断当前音素状态对应的音素是否是关键词音素；若是，对语音段进行关键词标记，记录语音段的语音位置。本发明通过指定声学状态和指定音素状态的获取，以采用样本无相关的方式对待检测语音进行关键词的检索，无需获取语音信息的标注数据，提高了关键词检索效率。

技术领域

本发明属于信息检索技术领域，尤其涉及一种关键词检索方法、系统、移动终端及存储介质。

背景技术

语音关键词检索是从语料库中确定出现指定关键词的语音数据，并确定该指定关键词在对应的语音数据中出现的位置。现有技术中，语音关键词检索方案主要基于语音识别技术，即将待检索语音数据转换为文本内容，确定文本内容中是否出现指定关键词，若出现指定关键词，进一步确定指定关键词出现的位置。

现有技术中的检索效果完全依赖于语音识别系统的识别效果，而训练一个大量词汇的语音识别系统需要大量的标注数据，由于公共安全领域对于某些小语种或方言语种进行关键词检索的需求日益迫切，考虑到特定语种熟悉人员相对有限，缺乏标注数据，因此，无法快速开发相应的语音识别系统，即无法利用主流的语音关键词检索方法进行关键词检索，降低了关键词检索的效率。

发明内容

本发明实施例的目的在于提供一种关键词检索方法、系统、移动终端及存储介质，旨在解决现有的关键词检索过程中，由于小语种或方言语种的标注数据较少所导致的关键词检索效率低下的问题。

本发明实施例是这样实现的，一种关键词检索方法，所述方法包括：

获取指定关键词库中每个指定关键词的指定声学状态和指定音素状态；

根据所述指定声学状态对滑窗的窗长进行设置，获取待检测语音的当前声学状态；

根据所述滑窗判断所述待检测语音中语音段的声学状态与所述指定声学状态是否匹配；

当判断到所述语音段的声学状态与所述指定声学状态匹配时，对所述语音段进行音素状态转换，得到当前音素状态；

根据所述指定音素状态判断所述当前音素状态对应的音素是否是关键词音素；

当判断到所述当前音素状态对应的音素是所述关键词音素时，对所述语音段进行关键词标记，并记录所述语音段的语音位置。

更进一步的，所述获取待检测语音的当前声学状态的步骤包括：

获取待检测语音的MFCC特征、PITCH特征和IVECTOR特征，并对所述MFCC特征、所述PITCH特征和所述IVECTOR特征进行向量转换，得到特征向量；

对所述特征向量进行向量合并，得到所述当前声学状态。