[发明专利]一种基于声音的哺乳母猪情绪识别方法在审
申请号: | 202011336356.4 | 申请日: | 2020-11-25 |
公开(公告)号: | CN112472090A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 杨阿庆;赵慧民;林智勇;刘晓勇;薛月菊;陈荣军;黄华盛;张磊;韩娜 | 申请(专利权)人: | 广东技术师范大学 |
主分类号: | A61B5/16 | 分类号: | A61B5/16;A61B5/00;G06N3/04;G06N3/08;G10L25/30;G10L25/63 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510665 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声音 哺乳 母猪 情绪 识别 方法 | ||
1.一种基于声音的哺乳母猪情绪识别方法,其特征在于,包括以下步骤:
1)采集猪栏区域的音频信号,包括母猪叫声、仔猪叫声和设备声音;
2)采用小波分解与重构除去音频信号中的仔猪叫声和设备声音,得到去噪后的母猪音频数据,即母猪目标声音;
3)将母猪目标声音作为输入数据输入预设的情绪识别网络模型判断母猪的情绪状态。
2.根据权利要求1所述的一种基于声音的哺乳母猪情绪识别方法,其特征在于:在步骤1)中,由于哺乳期母猪和仔猪圈养在一起,因此,音频数据包括母猪叫声、仔猪叫声和设备运作声,母猪叫声和仔猪叫声又统称为猪只叫声,猪只叫声包括母猪和仔猪进食、饮水、睡觉时的声音,仔猪玩耍打斗时的声音,母猪和仔猪交互时的声音。
3.根据权利要求1所述的一种基于声音的哺乳母猪情绪识别方法,其特征在于,所述步骤2)包括以下步骤:
2.1)对音频信号选择小波基函数和分解层数进行小波分解,分解后得到不同尺度的小波分解系数;
2.2)对不同尺度的小波分解系数选择阈值规则和阈值函数进行阈值处理,消除噪声在小波域的系数,得到处理后的小波系数,即母猪叫声信号的估计值;其中,所述阈值函数包括硬阈值和软阈值,所述阈值规则的选择有以下情况:
当噪声与目标声音重叠少时,选择固定阈值和启发式阈值估计规则,能彻底地去除噪声;当噪声与目标声音重叠多时,采用基于Stein的无偏似然估计原理的自适应阈值选择方法和极大极小阈值选择方法,能保留更多的目标声音;
2.3)对处理后的小波系数进行小波重构,得到去噪后的母猪音频数据,即母猪目标声音。
4.根据权利要求1所述的一种基于声音的哺乳母猪情绪识别方法,其特征在于,所述步骤3)包括以下步骤:
3.1)构建训练数据
3.1.1)按预设切割长度和重叠步长对母猪音频数据进行切割,得到固定长度的母猪声音样本;其中,所述重叠步长不能大于预设切割长度;
3.1.2)对母猪声音样本进行情绪标注,用标记“0”表示消极情绪,标记“1”表示积极情绪;
3.1.3)将标记好的母猪声音样本按3:1划分为2份,记为Set1和Set2;其中,所述Set1用于训练超参的训练验证集,Set2是用于训练网络参数的验证集,且Set2中的数据样本与Set1的数据样本来源于不同猪栏;
3.2)训练情绪识别网络模型
3.2.1)构建用于识别哺乳母猪情绪的网络结构,所述网络结构包括输入层、N个长短期记忆单元、1个全连接层、软最大分类器层和输出层;所述输入层用来自动将输入音频按照预设切割长度和重叠步长进行切割;所述长短期记忆单元用于提取所述输入音频的时序特征;所述全连接层对所述时序特征进一步进行特征提取和整合,设置全连接层输出神经元个数为2,则所述时序特征经过全连接层后输出2个特征值;所述软最大输出层以所述2个特征值为输入,输出所述2个特征值对应所述情绪类别的概率分布;所述输出层根据所述概率分布,输出情绪类别0或1;
3.2.2)设置训练参数,包括网络参数和超参;所述网络参数是需要通过训练来学习的参数,在进行首次训练时,网络参数需要进行初始化,初始化方法为随机初始化、Xavier初始化、MSRA中的任意一种;所述超参包括学习率、更新器和最大迭代次数;
3.2.3)将训练数据中带有情绪类别标记的母猪声音样本输入情绪识别网络模型,通过前向传播获取情绪预测结果,并计算预测结果与该母猪声音样本的情绪类别标记之间的损失,从而进行反向传播更新网络参数,使预测结果逐渐逼近真实标记,重复前向传播和反向传播,直至模型收敛,得到训练好的情绪识别网络模型;
其中,上述训练指的是一次完整的训练,为了能得到泛化性能好的网络模型,按照3.1.3)将训练数据划分为Set1和Set2份,Set1被随机划分为K等份作为K折交叉验证的训练验证集,用于寻找最优超参,Set2用于寻找泛化性能强的网络参数;
3.2.4)按照步骤2)提取待识别音频信号中的母猪音频数据,将待识别的母猪音频数据输入训练好的情绪识别网络模型中,经过一次前向传播输出待识别母猪声音所对应的情绪类别;其中,待识别的母猪音频数据输入情绪识别网络模型后,按照情绪识别网络模型输入层所预设的音频切割长度和重叠步长将待识别的母猪音频数据切割为N个子声音段,之后对每个子声音段的情绪类别进行判断,输出待识别的母猪音频数据对应的N个子声音段的情绪类别;
在训练情绪识别网络模型之前,按照所述步骤3.1.1)对母猪音频数据进行切割,得到固定长度的母猪声音样本,是为了获取固定长度声音样本对应的情绪类别标记,以便进行情绪识别网络模型的训练,在进行母猪声音情绪预测时不需要单独进行音频切割,情绪识别网络模型已经包括音频切割操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范大学,未经广东技术师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011336356.4/1.html,转载请声明来源钻瓜专利网。