[发明专利]动物声纹特征提取方法、装置及电子设备在审

申请号：	201810729268.7	申请日：	2018-07-05
公开（公告）号：	CN108899037A	公开（公告）日：	2018-11-27
发明（设计）人：	王健宗;蔡元哲;程宁;肖京	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L17/26	分类号：	G10L17/26;G10L17/18;G10L17/04;G10L17/02
代理公司：	北京中强智尚知识产权代理有限公司 11448	代理人：	黄耀威
地址：	518000 广东省深圳市福田街***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	动物语音装置及电子设备动物身份识别声纹特征提取声纹特征特征向量卷积神经网络动物身份申请
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种动物声纹特征提取方法、装置及电子设备，涉及动物身份识别技术领域，可以准确提取动物声纹特征，进而提高动物身份识别效果。所述方法包括：获取动物语音数据；从所述动物语音数据中提取动物语音特征向量；将所述动物语音特征向量输入至卷积神经网络模型进行训练，得到用于识别动物身份的动物声纹特征。

技术领域

本发明涉及动物身份识别技术领域，尤其是涉及到动物声纹特征提取方法、装置及电子设备。

背景技术

在最新的动物身份识别系统中，可以采用提取动物声纹特征来识别动物身份信息，进而确定动物身份。声纹识别是生物识别的一种，不同物种、不同个体均有其独特的声纹信息，人类可以通过动物声音区分出来是哪种动物，但是对于同一物种的不同个体发出的声音通过人耳确很难直接识别出来。

具体在动物身份识别过程中，实验测试的技术人员会将动物语音数据经过处理后放入语音库中，建立动物声纹特征库，通过动物声纹特征库记录动物的身份信息，进一步对确定身份的动物语音数据进行标签，从而确定动物身份，以便于在需要验证动物身份信息时，通过将待识别动物语音数据与动物声纹特征库中的动物语音数据进行比对，识别动物身份信息。

现有的动物声纹特征提取方法通常是将动物声音信号转换为语谱图，语谱图是声音信号的一种图像化表示方式，声音在各个频率点的幅值大小用颜色来区分，再通过不同的处理手段得到动物声纹特征。然而，通过分析语谱图的方式来提取动物声纹特征的准确度较低，使得动物声纹特征提取准确度受影响，另外，在提取动物声纹特征的过程中，环境的嘈杂以及多种声音的混杂都会影响声纹提取的效果。

发明内容

本发明实施例提供了动物声纹特征提取方法、装置及电子设备，解决了相关技术中无法准确提取动物声纹特征的问题。

根据本发明实施例的第一方面，提供一种动物声纹特征提取方法，所述方法包括：

获取动物语音数据；

从所述动物语音数据中提取动物语音特征向量；

将所述动物语音特征向量输入至卷积神经网络模型进行训练，得到用于识别动物身份的动物声纹特征。

进一步地，在所述获取动物语音数据之后，所述方法还包括：

对所述动物语音数据进行预处理，得到处理后的动物语音数据；

按照预设时间区间对处理后的动物语音数据进行分帧操作，得到多帧动物语音序列；

所述从所述动物语音数据中提取动物语音特征向量包括：

从所述多帧动物语音序列中提取出与所述多帧动物语音序列一一对应的多个动物语音特征向量。

进一步地，当所述动物语音特征向量用于反映动物语音在频谱结构随时间变化的特征信息，所述从所述动物语音数据中提取动物语音特征向量包括：