[发明专利]一种录音控制方法及装置有效
申请号: | 201811076604.9 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109065026B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 任晓楠;崔保磊;陈中帅 | 申请(专利权)人: | 海信集团有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/06;G10L17/00;G10L17/04 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
地址: | 266071 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 录音 控制 方法 装置 | ||
1.一种录音控制方法,其特征在于,所述方法包括:
基于目标说话人的特定语音数据控制拾音设备开始录音;所述特定语音数据为用于唤醒拾音设备的激活词;
按照预设的采样规则对所述拾音设备录制的语音数据进行采样,得到采样数据;
对所述采样数据进行特征提取,得到所述采样数据的特征值;
将所述采样数据的特征值输入已训练的目标说话人模型,得到所述目标说话人模型的输出结果,其中,所述已训练的目标说话人模型以语音数据的特征值为输入值,以所述语音数据与所述目标说话人的匹配程度为输出值;若根据所述输出结果确定所述采样数据与所述目标说话人不匹配,则控制所述拾音设备停止录音;
其中,所述目标说话人模型通过如下方法获得:
对所述特定语音数据进行特征提取,得到所述特定语音数据的特征值;
针对已训练的至少一个说话人模型中的任一说话人模型,按照预设的运算规则对所述说话人模型与所述特定语音数据的特征值进行运算;
若存在运算结果大于预设的匹配阈值的说话人模型,则在所述运算结果大于预设的匹配阈值的说话人模型中,将运算结果最高的说话人模型确定为目标说话人模型。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取至少一条历史语音数据;
对获取到的历史语音数据进行聚类,得到至少一个类,其中,任一所述类中包括至少一条历史语音数据;
针对任一所述类执行以下步骤:分别对所述类中的每一条历史语音数据进行特征提取,获得所述类对应的训练样本,其中,所述训练样本以提取到的特征值为输入值;
利用所述训练样本进行训练,得到所述类对应的说话人模型,其中,所述说话人模型以语音数据的特征值为输入值,以所述语音数据与所述类对应的说话人的匹配程度为输出值。
3.根据权利要求2所述的方法,其特征在于,所述将所述采样数据的特征值输入已训练的目标说话人模型,得到所述目标说话人模型的输出结果,包括:
确定已训练的至少一个说话人模型中,是否存在所述目标说话人对应的目标说话人模型;
若存在,则将所述采样数据的特征值输入已训练的目标说话人模型,得到所述目标说话人模型的输出结果。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若已训练的至少一个说话人模型中,不存在所述目标说话人对应的目标说话人模型,则将所述采样数据的特征值与前一个采样数据的特征值进行相关性计算,得到所述采样数据与所述前一个采样数据的相关性系数;
若所述相关性系数小于预设的相关性阈值,则控制所述拾音设备停止录音。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若根据所述输出结果确定所述采样数据与所述目标说话人匹配,则返回执行所述按照预设的采样规则对所述拾音设备录制的语音数据进行采样,得到采样数据的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海信集团有限公司,未经海信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811076604.9/1.html,转载请声明来源钻瓜专利网。