[发明专利]语音查询方法、装置、计算机设备及存储介质在审
申请号: | 202010456585.3 | 申请日: | 2020-05-26 |
公开(公告)号: | CN111611349A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 赵亮 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/242;G10L15/00;G10L15/06;G10L15/16;G10L15/22 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 查询 方法 装置 计算机 设备 存储 介质 | ||
1.一种语音查询方法,其特征在于,包括:
接收包含场景标识符的场景查询指令,获取源语音数据;
将所述源语音数据输入训练完成的深度学习拼音识别模型,所述深度学习拼音识别模型提取出所述源语音数据中的语音拼音特征,获取所述深度学习拼音识别模型根据所述语音拼音特征输出的拼音序列数据;其中,所述拼音序列数据包括拼音数据及其对应的音调数据;
从与所述场景标识符匹配的拼音词典中查找出与所述拼音序列数据中包含的拼音串匹配的关键词拼音串,将所述拼音序列数据中的所有所述拼音串替换成与其匹配的所述关键词拼音串对应的关键词,将替换后的所述拼音序列数据记录为拼音转换数据;其中,所述拼音转换数据包括拼音数据及其对应的音调数据和所述关键词;
将所述拼音转换数据输入语言识别模型,所述语言识别模型提取出所述拼音转换数据中所有所述拼音数据及其对应的音调数据的词义特征,所述语言识别模型根据所述词义特征预测出所有所述拼音数据及其对应的音调数据在所述拼音转换数据中的预测汉字,将所有所述预测汉字替代与其对应的所述拼音数据及其对应的音调数据,将替代后的所述拼音转换数据记录为最终语音数据;
将所述最终语音数据输入SQL语句转换模型,所述SQL语句转换模型将所述最终语音数据转换成SQL查询语句,通过执行所述SQL查询语句获取查询结果并进行展示。
2.如权利要求1所述的语音查询方法,其特征在于,所述深度学习拼音识别模型提取出所述源语音数据中的语音拼音特征,获取所述深度学习拼音识别模型根据所述语音拼音特征输出的拼音序列数据,包括:
通过分帧加窗的方法,对所述源语音数据进行音频转换,得到二维音频图像信号;
将所述二维音频图像信号输入所述深度学习拼音识别模型中的声学模型,所述声学模型提取所述二维音频图像信号的语音拼音特征,获取所述声学模型根据提取出的所述二维音频图像信号的语音拼音特征输出的语音序列数组;所述声学模型为基于Keras和TensorFlow训练的深度卷积神经网络模型;
对所述语音序列数组进行解码,得到所述源语音数据的所述拼音序列数据。
3.如权利要求2所述的语音查询方法,其特征在于,所述对所述语音序列数组进行解码,得到所述源语音数据的所述拼音序列数据,包括:
将所述语音序列数组中连续重复的拼音字母进行合并,得到合并数组;
在所述合并数组中的每个所述拼音数据后增加其对应的所述音调数据,得到增强数组;
去除所述增强数组中的静音分隔符,将去除后的所述增强数组确定为所述拼音序列数据。
4.如权利要求1所述的语音查询方法,其特征在于,所述将所述源语音数据输入训练完成的深度学习拼音识别模型之前,包括:
获取语音样本集,所述语音样本集包括多个训练样本,每个所述训练样本都对应一个结果标签;
将所述训练样本输入含有初始参数的拼音识别模型;
所述拼音识别模型提取出所述训练样本中的语音拼音特征,所述拼音识别模型根据所述训练样本中的语音拼音特征输出所述训练样本的识别结果和损失值;
在所述损失值未达到预设的收敛条件时,迭代更新所述拼音识别模型的初始参数,直至所述损失值达到所述预设的收敛条件时,将收敛之后的所述拼音识别模型记录为训练完成的深度学习拼音识别模型;
在所述损失值达到预设的收敛条件时,将收敛之后的所述拼音识别模型记录为训练完成的深度学习拼音识别模型。
5.如权利要求1所述的语音查询方法,其特征在于,所述从与所述场景标识符匹配的拼音词典中查找出与所述拼音序列数据中包含的拼音串匹配的关键词拼音串之前,包括:
获取与所述场景标识符匹配的预设词库中的所有定制词语;
将所有所述定制词语进行拼音转换,得到每个所述定制词语对应的定制词语拼音串;
按照字典树构建方式,将所有所述定制词语拼音串构建成所述拼音词典,并将所述拼音词典与所述场景标识符关联;所述拼音词典中包含拼音与汉字的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010456585.3/1.html,转载请声明来源钻瓜专利网。