[发明专利]动物声纹特征提取方法、装置及电子设备在审
申请号: | 201810729268.7 | 申请日: | 2018-07-05 |
公开(公告)号: | CN108899037A | 公开(公告)日: | 2018-11-27 |
发明(设计)人: | 王健宗;蔡元哲;程宁;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/26 | 分类号: | G10L17/26;G10L17/18;G10L17/04;G10L17/02 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动物语音 装置及电子设备 动物身份识别 声纹特征提取 声纹特征 特征向量 卷积神经网络 动物身份 申请 | ||
本申请公开了一种动物声纹特征提取方法、装置及电子设备,涉及动物身份识别技术领域,可以准确提取动物声纹特征,进而提高动物身份识别效果。所述方法包括:获取动物语音数据;从所述动物语音数据中提取动物语音特征向量;将所述动物语音特征向量输入至卷积神经网络模型进行训练,得到用于识别动物身份的动物声纹特征。
技术领域
本发明涉及动物身份识别技术领域,尤其是涉及到动物声纹特征提取方法、装置及电子设备。
背景技术
在最新的动物身份识别系统中,可以采用提取动物声纹特征来识别动物身份信息,进而确定动物身份。声纹识别是生物识别的一种,不同物种、不同个体均有其独特的声纹信息,人类可以通过动物声音区分出来是哪种动物,但是对于同一物种的不同个体发出的声音通过人耳确很难直接识别出来。
具体在动物身份识别过程中,实验测试的技术人员会将动物语音数据经过处理后放入语音库中,建立动物声纹特征库,通过动物声纹特征库记录动物的身份信息,进一步对确定身份的动物语音数据进行标签,从而确定动物身份,以便于在需要验证动物身份信息时,通过将待识别动物语音数据与动物声纹特征库中的动物语音数据进行比对,识别动物身份信息。
现有的动物声纹特征提取方法通常是将动物声音信号转换为语谱图,语谱图是声音信号的一种图像化表示方式,声音在各个频率点的幅值大小用颜色来区分,再通过不同的处理手段得到动物声纹特征。然而,通过分析语谱图的方式来提取动物声纹特征的准确度较低,使得动物声纹特征提取准确度受影响,另外,在提取动物声纹特征的过程中,环境的嘈杂以及多种声音的混杂都会影响声纹提取的效果。
发明内容
本发明实施例提供了动物声纹特征提取方法、装置及电子设备,解决了相关技术中无法准确提取动物声纹特征的问题。
根据本发明实施例的第一方面,提供一种动物声纹特征提取方法,所述方法包括:
获取动物语音数据;
从所述动物语音数据中提取动物语音特征向量;
将所述动物语音特征向量输入至卷积神经网络模型进行训练,得到用于识别动物身份的动物声纹特征。
进一步地,在所述获取动物语音数据之后,所述方法还包括:
对所述动物语音数据进行预处理,得到处理后的动物语音数据;
按照预设时间区间对处理后的动物语音数据进行分帧操作,得到多帧动物语音序列;
所述从所述动物语音数据中提取动物语音特征向量包括:
从所述多帧动物语音序列中提取出与所述多帧动物语音序列一一对应的多个动物语音特征向量。
进一步地,当所述动物语音特征向量用于反映动物语音在频谱结构随时间变化的特征信息,所述从所述动物语音数据中提取动物语音特征向量包括:
对每帧动物语音序列进行傅立叶变换得到每帧动物语音序列的频谱,并对所述每帧动物语音序列的频谱取模平方得到动物语音序列的功率谱;
通过预设滤波器对所述动物语音序列的功率谱滤波,得到动物语音序列的对数能量;
对所述动物语音序列的对数能量进行离散余弦变换,得到动物语音特征向量。
进一步地,当所述动物语音特征向量用于反映动物语音在频谱结构上的特征信息,所述从所述动物语音数据中提取动物语音特征向量包括:
对每帧动物语音序列进行时域分析以及频域分析,计算每帧动物语音序列的时域特征参数以及频域特征参数;
根据所述时域特征参数以及频域特征参数,得到动物语音特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810729268.7/2.html,转载请声明来源钻瓜专利网。