[发明专利]关键词检索方法、系统、移动终端及存储介质有效
申请号: | 202010239637.1 | 申请日: | 2020-03-30 |
公开(公告)号: | CN111462777B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 张广学;肖龙源;李稀敏;刘晓葳;叶志坚 | 申请(专利权)人: | 厦门快商通科技股份有限公司 |
主分类号: | G10L25/54 | 分类号: | G10L25/54;G10L25/03;G10L25/45;G06F16/9032 |
代理公司: | 厦门仕诚联合知识产权代理事务所(普通合伙) 35227 | 代理人: | 吴圳添 |
地址: | 361009 福建省厦门市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 检索 方法 系统 移动 终端 存储 介质 | ||
1.一种关键词检索方法,其特征在于,所述方法包括:
获取指定关键词库中每个指定关键词的指定声学状态和指定音素状态;
根据所述指定声学状态对滑窗的窗长进行设置,获取待检测语音的当前声学状态,并将所述滑窗设置为所述当前声学状态;
根据所述滑窗判断所述待检测语音中语音段的声学状态与所述指定声学状态是否匹配;
当判断到所述语音段的声学状态与所述指定声学状态匹配时,对所述语音段进行音素状态转换,得到当前音素状态;
根据所述指定音素状态判断所述当前音素状态对应的音素是否是关键词音素;
当判断到所述当前音素状态对应的音素是所述关键词音素时,对所述语音段进行关键词标记,并记录所述语音段的语音位置;
所述根据所述滑窗判断所述待检测语音中语音段的声学状态与所述指定声学状态是否匹配的步骤包括:
根据所述滑窗依序获取所述待检测语音中每帧语音帧内所述语音段的语音声学状态;
判断所述语音声学状态与所述指定声学状态是否相同/相似;
当判断到所述语音声学状态与所述指定声学状态相同/相似时,则判定对应所述语音段的声学状态与所述指定声学状态相匹配;
所述对所述语音段进行音素状态转换,得到当前音素状态的步骤包括:
将所述语音段转换为拼音,得到拼音串,并对所述拼音串内的辅音音素和元音音素进行分隔;
对所述拼音串中相邻的音素进行组合,得到待检测音素对,并对所述待检测语音进行语音端点检测,得到端点检测结果;
根据所述端点检测结果对所述拼音串中的所述待检测音素对进行静音标记,以得到所述当前音素状态。
2.如权利要求1所述的关键词检索方法,其特征在于,所述获取待检测语音的当前声学状态的步骤包括:
获取待检测语音的MFCC特征、PITCH特征和IVECTOR特征,并对所述MFCC特征、所述PITCH特征和所述IVECTOR特征进行向量转换,得到特征向量;
对所述特征向量进行向量合并,得到所述当前声学状态。
3.如权利要求1所述的关键词检索方法,其特征在于,所述根据所述指定声学状态对滑窗的窗长进行设置的步骤包括:
计算每个所述指定声学状态的长度,并依据最大长度的所述指定声学状态设置所述滑窗的窗长。
4.如权利要求1所述的关键词检索方法,其特征在于,所述根据所述端点检测结果对所述拼音串中的所述待检测音素对进行静音标记的步骤包括:
分别获取每个所述待检测音素对末端音素在所述端点检测结果中对应的静音时长;
根据所述静音时长查询时长标识,并根据所述时长标识对所述待检测音素对进行时长标记。
5.如权利要求4所述的关键词检索方法,其特征在于,所述根据所述指定音素状态判断所述当前音素状态对应的音素是否是关键词音素的步骤包括:
将所述指定音素状态中存储的指定音素对与所述当前音素状态中存储的所述待检测音素对进行匹配;
当所述指定音素对与所述待检测音素对匹配成功时,判断所述指定音素对和所述待检测音素对上的所述时长标识是否一致;
当判断到所述时长标识一致时,则判定所述当前音素状态是所述关键词音素。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门快商通科技股份有限公司,未经厦门快商通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010239637.1/1.html,转载请声明来源钻瓜专利网。