[发明专利]关键词检索方法、系统、移动终端及存储介质有效
申请号: | 202010239637.1 | 申请日: | 2020-03-30 |
公开(公告)号: | CN111462777B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 张广学;肖龙源;李稀敏;刘晓葳;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G10L25/03;G10L25/45;G06F16/9032 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 吴圳添 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 检索 方法 系统 移动 终端 存储 介质 | ||
本发明提供了一种关键词检索方法、系统、移动终端及存储介质,该方法包括:获取指定关键词库中每个指定关键词的指定声学状态和指定音素状态;根据指定声学状态对滑窗的窗长进行设置,获取待检测语音的当前声学状态,将滑窗设置为当前声学状态;根据滑窗判断待检测语音中语音段的声学状态与指定声学状态是否匹配;若是,则对语音段进行音素状态转换,得到当前音素状态;根据指定音素状态判断当前音素状态对应的音素是否是关键词音素;若是,对语音段进行关键词标记,记录语音段的语音位置。本发明通过指定声学状态和指定音素状态的获取,以采用样本无相关的方式对待检测语音进行关键词的检索,无需获取语音信息的标注数据,提高了关键词检索效率。
技术领域
本发明属于信息检索技术领域,尤其涉及一种关键词检索方法、系统、移动终端及存储介质。
背景技术
语音关键词检索是从语料库中确定出现指定关键词的语音数据,并确定该指定关键词在对应的语音数据中出现的位置。现有技术中,语音关键词检索方案主要基于语音识别技术,即将待检索语音数据转换为文本内容,确定文本内容中是否出现指定关键词,若出现指定关键词,进一步确定指定关键词出现的位置。
现有技术中的检索效果完全依赖于语音识别系统的识别效果,而训练一个大量词汇的语音识别系统需要大量的标注数据,由于公共安全领域对于某些小语种或方言语种进行关键词检索的需求日益迫切,考虑到特定语种熟悉人员相对有限,缺乏标注数据,因此,无法快速开发相应的语音识别系统,即无法利用主流的语音关键词检索方法进行关键词检索,降低了关键词检索的效率。
发明内容
本发明实施例的目的在于提供一种关键词检索方法、系统、移动终端及存储介质,旨在解决现有的关键词检索过程中,由于小语种或方言语种的标注数据较少所导致的关键词检索效率低下的问题。
本发明实施例是这样实现的,一种关键词检索方法,所述方法包括:
获取指定关键词库中每个指定关键词的指定声学状态和指定音素状态;
根据所述指定声学状态对滑窗的窗长进行设置,获取待检测语音的当前声学状态;
根据所述滑窗判断所述待检测语音中语音段的声学状态与所述指定声学状态是否匹配;
当判断到所述语音段的声学状态与所述指定声学状态匹配时,对所述语音段进行音素状态转换,得到当前音素状态;
根据所述指定音素状态判断所述当前音素状态对应的音素是否是关键词音素;
当判断到所述当前音素状态对应的音素是所述关键词音素时,对所述语音段进行关键词标记,并记录所述语音段的语音位置。
更进一步的,所述获取待检测语音的当前声学状态的步骤包括:
获取待检测语音的MFCC特征、PITCH特征和IVECTOR特征,并对所述MFCC特征、所述PITCH特征和所述IVECTOR特征进行向量转换,得到特征向量;
对所述特征向量进行向量合并,得到所述当前声学状态。
更进一步的,所述根据所述指定声学状态对滑窗的窗长进行设置的步骤包括:
计算每个所述指定声学状态的长度,并将最大长度的所述指定声学状态设置所述滑窗的窗长。
更进一步的,所述根据所述滑窗判断所述待检测语音中语音段的声学状态与所述指定声学状态是否匹配的步骤包括:
根据所述滑窗依序获取所述待检测语音中每帧语音帧内所述语音段的语音声学状态;
判断所述语音声学状态与所述指定声学状态是否相同/相似;
当判断到所述语音声学状态与所述指定声学状态相同/相似时,则判定对应所述语音段的声学状态与所述指定声学状态相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010239637.1/2.html,转载请声明来源钻瓜专利网。