[发明专利]命令的识别方法、装置及计算机可读存储介质在审
申请号: | 202011436338.3 | 申请日: | 2020-12-10 |
公开(公告)号: | CN112669836A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 黄炜;钟晓雄;张伟哲;束建钢;艾建文;黄兴森 | 申请(专利权)人: | 鹏城实验室 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/16;G10L17/00;G10L17/18;G10L25/24 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 关向兰 |
地址: | 518000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命令 识别 方法 装置 计算机 可读 存储 介质 | ||
本发明公开了一种命令的识别方法、装置及计算机可读存储介质,方法包括:命令的识别装置获取第一语音信息;将第一语音信息输入命令识别模型,得到命令词的第一特征向量,命令识别模型通过用户自定义的各个命令训练得到;在命令词的特征向量库中存储有与第一特征向量匹配的第二特征向量时,响应第一语音信息对应的命令。本发明提高了命令的识别效率。
技术领域
本发明涉及深度学习技术领域,尤其涉及一种命令的识别方法、装置及计算机可读存储介质。
背景技术
对于由于深度学习的出现,命令的识别变得越来越重要,大量的产品使用语音识别来控制家用与工业系统,但是由于系统不能及时响应相关的命令,则可能出现一系列事故,由此可见,现有技术对命令的识别效率低。
发明内容
本发明实施例通过提供一种命令的识别方法、装置及计算机可读存储介质,旨在解决现有技术对命令的识别效率低的技术问题。
本发明实施例提供一种命令的识别方法,所述命令的识别方法包括:
获取第一语音信息;
将所述第一语音信息输入命令识别模型,得到命令词的第一特征向量,所述命令识别模型通过用户自定义的各个命令训练得到;
在命令词的特征向量库中存储有与所述第一特征向量匹配的第二特征向量时,响应所述第一语音信息对应的命令。
在一实施例中,所述将所述第一语音信息输入命令识别模型的步骤之后,还包括:
确定声纹特征向量库中是否存储有与第三特征向量匹配的第四特征向量,其中,所述第一语音信息输入命令识别模型得到命令词的第一特征向量以及声纹的第三特征向量;
在确定声纹特征向量库中存储有与第三特征向量匹配的第四特征向量时,确定命令词的特征向量库中是否存储有与所述第一特征匹配的第二特征向量;
在命令词的特征向量库中存储有与所述第一特征向量匹配的第二特征向量时,执行所述响应所述第一语音信息对应的命令的步骤。
在一实施例中,对所述命令词的第一特征向量以及声纹的第三特征向量进行维度规约。
在一实施例中,所述获取第一语音信息的步骤之前,所述方法还包括:
获取各个训练样本,训练样本包括用户的声纹特征以及第二语音信息,所述第二语音信息包括用户自定义的命令;
根据各个所述训练样本对预设模型进行训练,以得到所述命令识别模型并保存所述命令识别模型。
本发明实施例提供一种命令的识别方法,所述根据各个所述训练样本对预设模型进行训练的步骤包括:
获取第一损失函数部分以及第二损失函数部分,所述第一损失函数部分根据用户的声纹确定,所述第二损失函数部分根据命令词确定;
根据所述第一损失函数部分以及所述第二损失函数部分,设置预设模型的损失函数得到第一训练模型;
根据各个所述训练样本对所述第一训练模型进行训练。
在一实施例中,所述根据各个所述训练样本对预设模型进行训练的步骤还包括:
在所述预设模型的神经网络中,去除预设比例的神经元,得到第二训练模型;
根据各个所述训练样本对所述第二训练模型进行训练。
在一实施例中,所述训练样本还包括高斯噪声。
在一实施例中,所述获取各个训练样本的步骤包括:
获取用户对应的待处理第一语音信息以及声纹特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室,未经鹏城实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011436338.3/2.html,转载请声明来源钻瓜专利网。