[发明专利]命令的识别方法、装置及计算机可读存储介质在审
申请号: | 202011436338.3 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112669836A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 黄炜;钟晓雄;张伟哲;束建钢;艾建文;黄兴森 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L17/00;G10L17/18;G10L25/24 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 关向兰 |
地址: | 518000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命令 识别 方法 装置 计算机 可读 存储 介质 | ||
1.一种命令的识别方法,其特征在于,所述命令的识别方法包括:
获取第一语音信息;
将所述第一语音信息输入命令识别模型,得到命令词的第一特征向量,所述命令识别模型通过用户自定义的各个命令训练得到;
在命令词的特征向量库中存储有与所述第一特征向量匹配的第二特征向量时,响应所述第一语音信息对应的命令。
2.如权利要求1所述的方法,其特征在于,所述将所述第一语音信息输入命令识别模型的步骤之后,还包括:
确定声纹特征向量库中是否存储有与第三特征向量匹配的第四特征向量,其中,所述第一语音信息输入命令识别模型得到命令词的第一特征向量以及声纹的第三特征向量;
在确定声纹特征向量库中存储有与第三特征向量匹配的第四特征向量时,确定命令词的特征向量库中是否存储有与所述第一特征匹配的第二特征向量;
在命令词的特征向量库中存储有与所述第一特征向量匹配的第二特征向量时,执行所述响应所述第一语音信息对应的命令的步骤。
3.如权利要求2所述的方法,其特征在于,对所述命令词的第一特征向量以及声纹的第三特征向量进行维度规约。
4.如权利要求3所述的方法,其特征在于,所述获取第一语音信息的步骤之前,所述方法还包括:
获取各个训练样本,训练样本包括用户的声纹特征以及第二语音信息,所述第二语音信息包括用户自定义的命令;
根据各个所述训练样本对预设模型进行训练,以得到所述命令识别模型并保存所述命令识别模型。
5.如权利要求4所述的方法,其特征在于,所述根据各个所述训练样本对预设模型进行训练的步骤包括:
获取第一损失函数部分以及第二损失函数部分,所述第一损失函数部分根据用户的声纹确定,所述第二损失函数部分根据命令词确定;
根据所述第一损失函数部分以及所述第二损失函数部分,设置预设模型的损失函数得到第一训练模型;
根据各个所述训练样本对所述第一训练模型进行训练。
6.如权利要求4所述的方法,其特征在于,所述根据各个所述训练样本对预设模型进行训练的步骤还包括:
在所述预设模型的神经网络中,去除预设比例的神经元,得到第二训练模型;
根据各个所述训练样本对所述第二训练模型进行训练。
7.如权利要求4所述的方法,其特征在于,所述训练样本还包括高斯噪声。
8.如权利要求4所述的方法,其特征在于,所述获取各个训练样本的步骤包括:
获取用户对应的待处理第一语音信息以及声纹特征;
确定所述待处理第一语音信息的各个采样点,并生成每个采样点对应的随机函数;
根据所述随机函数,对所述待处理第一语音信息中所述采样点对应的音频进行时序调整,所述时序调整包括快进与减速。
9.一种命令的识别装置,其特征在于,所述命令的识别装置包括:命令词模型、存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的命令的识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的命令的识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011436338.3/1.html,转载请声明来源钻瓜专利网。