[发明专利]带噪语音情感识别方法、系统、设备及存储介质有效
申请号: | 202110332451.5 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113053417B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 姜晓庆;陈贞翔;杨倩;郑永强 | 申请(专利权)人: | 济南大学;山东思正信息科技有限公司 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L25/87;G10L25/30 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250022 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 情感 识别 方法 系统 设备 存储 介质 | ||
1.带噪语音情感识别方法,其特征是,包括:
获取待识别的带噪语音信号;
对待识别的带噪语音信号进行端点检测处理;根据端点得到若干个有声音的语音片段;
对有声音的语音片段进行特征提取,得到语音特征;
将语音特征输入到训练后的语音情感识别模型中,输出情感类别;
所述对待识别的带噪语音信号进行端点检测处理;根据端点得到若干个有声音的语音片段;具体包括:
对待识别的带噪语音信号进行稀疏转换处理;
对稀疏转换处理后的语音信号,随机生成高斯随机矩阵;将高斯随机矩阵作为语音信号的观测矩阵;
基于观测矩阵,采用正交匹配追踪算法OMP进行样本重建,得到端点检测结果;
所述基于观测矩阵,采用正交匹配追踪算法OMP进行样本重建,得到端点检测结果;具体包括:
(1):根据观测矩阵,得到每一帧的语音观测值;
(2):首次运行时,残差设定为语音观测值,计算残差与传感矩阵的相关系数;
非首次运行时,计算上一次迭代估计值与语音观测值的残差,和残差与传感矩阵的相关系数;
(3):在传感矩阵中,寻找相关系数最大原子,利用相关系数最大原子更新信号重建的支撑集;
(4):基于支撑集,使用最小二乘法对观测值进行逼近,得到的信号的估计值;
(5):更新残差,计算残差条件熵;
(6):判断是否达到稀疏度条件,如果是,就返回(2);如果否,就计算第一次迭代与最后一次迭代的残差条件熵差值,且此时的信号的估计值认为是重建样本;
(7):判断第一次迭代与最后一次迭代的残差条件熵差值是否高于设定阈值,如果高于设定阈值,则认为当前帧语音为有声段;如果低于设定阈值,则认为当前帧语音为无声段,获得当前帧语音的端点检测结果;
(8):基于端点检测结果,获得重建样本中的有声音的语音片段。
2.如权利要求1所述的带噪语音情感识别方法,其特征是,对待识别的带噪语音信号进行稀疏转换处理;具体包括:
采用离散余弦变换,对待识别的带噪语音信号进行稀疏转换处理。
3.如权利要求1所述的带噪语音情感识别方法,其特征是,计算上一次迭代估计值与语音观测值的残差,和残差与传感矩阵的相关系数;具体包括:
第t次迭代所获得的重建残差rt的计算公式为:
其中,At是OMP算法第t次迭代过程中由传感矩阵的原子构成的支撑集,为第t次迭代过程中最小二乘法计算的估计值,y是观测值。
4.如权利要求1所述的带噪语音情感识别方法,其特征是,更新残差,计算残差条件熵;具体包括:
对每次迭代得到的残差进行存储,更新残差;
基于更新后的残差,计算残差条件熵;
所述基于更新后的残差,计算残差条件熵;残差条件熵σe的计算公式为:
At-1是OMP算法第t-1次迭代过程中由传感矩阵的原子构成的支撑集,为t-1次迭代过程中最小二乘法计算的估计值。
5.如权利要求1所述的带噪语音情感识别方法,其特征是,稀疏度条件指的是在样本重建过程中每次迭代完之后要判断迭代次数与稀疏度K的大小来判断是否终止迭代;如果迭代次数小于K要继续迭代,否则终止迭代。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南大学;山东思正信息科技有限公司,未经济南大学;山东思正信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110332451.5/1.html,转载请声明来源钻瓜专利网。