[发明专利]语音搜索优化方法、装置和系统有效
申请号: | 201810501682.2 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108694939B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 李忠杰 | 申请(专利权)人: | 广州视源电子科技股份有限公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/02;G10L15/26 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 刘艳丽 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 搜索 优化 方法 装置 系统 | ||
1.一种语音搜索优化方法,其特征在于,包括步骤:
获取输入信号,并将所述输入信号与预置模板进行匹配分析;
若存在与所述输入信号匹配的所述预置模板,则重置WFST网络的搜索状态;所述匹配是指所述输入信号的信息与所述预置模板的信息相同或相似度达到设定阈值以上;
根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的所述预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;所述前置搜索是将与所述输入信号匹配的所述预置模板,输入到重置搜索状态后的WFST网络进行搜索,所述优化WFST网络为匹配的所述预置模板的搜索路径网络;
根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。
2.根据权利要求1所述的语音搜索优化方法,其特征在于,所述输入信号包括所述语音信号;将所述输入信号与预置模板进行匹配分析的过程,包括:
对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;
将所述声学特征信息与所述预置模板的声学特征信息进行匹配。
3.根据权利要求2所述的语音搜索优化方法,其特征在于,将所述输入信号与预置模板进行匹配分析的过程,还包括:
对所述语音信号进行语音识别,得到识别结果;
将所述识别结果与所述预置模板进行匹配。
4.根据权利要求1至3任一项所述的语音搜索优化方法,其特征在于,若存在与所述输入信号匹配的预置模板,则重置WFST网络的搜索状态的步骤之前,还包括:
获取所述语音信号;
对所述语音信号进行特征提取,得到所述语音信号的声学特征信息;
根据所述声学特征信息,通过预先训练的声学模型对所述语音信号进行分类计算,得到所述语音信号的分类及对应的分类概率;其中,所述分类概率用于所述WFST网络对所述语音信号的搜索。
5.根据权利要求4所述的语音搜索优化方法,其特征在于,所述输入信号还包括所述声学特征信息;将所述输入信号与预置模板进行匹配分析的过程,还包括:
根据所述声学特征信息进行语音识别,得到识别结果;
将所述识别结果与所述预置模板进行匹配。
6.根据权利要求5所述的语音搜索优化方法,其特征在于,将所述输入信号与预置模板进行匹配分析的过程,还包括:
将所述声学特征信息与所述预置模板的声学特征信息进行匹配。
7.根据权利要求5所述的语音搜索优化方法,其特征在于,所述输入信号还包括所述WFST网络对所述语音信号搜索得到的阶段结果;将所述输入信号与预置模板进行匹配分析的过程,还包括:
将所述阶段结果与所述预置模板进行匹配。
8.根据权利要求1、2、3、5、6和7任一项所述的语音搜索优化方法,其特征在于,所述预置模板包括设定领域的词序列、词序列对应的声学特征信息或音素序列。
9.一种语音搜索优化装置,其特征在于,包括:
匹配分析模块,用于获取输入信号,并将所述输入信号与预置模板进行匹配分析;
搜索重置模块,用于若存在与所述输入信号匹配的预置模板,则重置WFST网络的搜索状态;所述匹配是指所述输入信号的信息与所述预置模板的信息相同或相似度达到设定阈值以上;
前置搜索模块,用于根据重置搜索状态后的所述WFST网络,对与所述输入信号匹配的预置模板进行前置搜索,获得与所述预置模板相对应的优化WFST网络;所述前置搜索是将与所述输入信号匹配的所述预置模板,输入到重置搜索状态后的WFST网络进行搜索,所述优化WFST网络为匹配的所述预置模板的搜索路径网络;
搜索结果获取模块,用于根据所述优化WFST网络,完成各帧的语音信号的搜索,得到搜索结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司,未经广州视源电子科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810501682.2/1.html,转载请声明来源钻瓜专利网。