[发明专利]基于机器学习的语音情感识别系统及方法有效
申请号: | 201811186572.8 | 申请日: | 2018-10-12 |
公开(公告)号: | CN109256150B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 徐心;胡宇澄;王麒铭;饶鹏 | 申请(专利权)人: | 北京创景咨询有限公司;徐心 |
主分类号: | G10L25/63 | 分类号: | G10L25/63;G10L17/00;G10L17/02;G10L17/04;G10L17/18;G10L25/24 |
代理公司: | 北京纽乐康知识产权代理事务所(普通合伙) 11210 | 代理人: | 白明珠 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机器 学习 语音 情感 识别 系统 方法 | ||
1.一种基于机器学习的语音情感识别系统,其特征在于,包括录音降噪模块、断句模块、说话人识别模块、特征提取模块和情感识别模块,其中,
录音降噪模块,用于获取录音数据,利用相关算法对录音数据进行降噪预处理;
断句模块,用于接收录音降噪模块传输过来的录音数据,根据语音学的相关特征将录音数据切割成片段;
说话人识别模块,用于接收断句模块传输过来的片段,利用机器学习算法将片段分类,并根据分类对说话人进行识别;
特征提取模块,用于接收断句模块传输过来的片段,对每个片段提取频谱特征及梅尔倒谱系数,并在其上进行处理后提取片段特征;
情感识别模块,用于接收特征提取模块生成的片段特征,通过机器学习算法对情感预测模型进行训练,并利用集成算法对每个模型的预测结果进行集成;
所述断句模块包括:第二分类模块,用于根据机器学习中的聚类方法,将不同语音帧分为人声和非人声两类;聚合模块,用于基于规则的方法,将分类好的语音帧聚合为人声和非人声片段;
所述录音降噪模块中降噪预处理包括:
训练学习模块,用于输入一个有损的数据,利用有损数据进行训练学习;
输出模块,用于将未被损坏的数据作为深度学习算法的输出;
第一处理模块,用于根据训练好的模型对其他有损数据进行处理;
所述说话人识别模块包括:
分类模块,用于利用不同建模方法将录音数据中的不同片段和语音帧分为两类或者多类;
第一集成模块,用于对各个模型的分类结果进行集成,对不同说话人的语音片段的实时及批量的分类标记;
所述特征提取模块包括:
提取模块,用于将各个模型根据其建模需要提取各类不同的特征指标;
第二处理模块,用于对梅尔倒谱系数的不同维度指标进行加工处理生成识别特征;
转换模块,用于通过原始语音时域信号,以及其转换生成的语谱图进行图像特征的提取;
所述情感识别模块包括:
输入模块,用于将训练样本利用提取出来的各类特征,输入到不同的机器学习算法模型中进行训练学习;
第二集成模块,用于将各个模型训练后得到的不同预测结果进行集成;
预测模块,用于通过调整不同模型得到不同应用场景下预测效果最终的整体模型,利用最终的整体模型预测其他未知的片段情感。
2.一种基于机器学习的语音情感识别方法,其特征在于,包括以下步骤:
S1 获取录音数据,利用相关算法对录音数据进行降噪预处理;
S2 接收录音降噪模块传输过来的录音数据,根据语音学的相关特征将录音数据切割成片段;
S3 接收断句模块传输过来的片段,利用机器学习算法将片段分类,并根据分类对说话人进行识别;
S4 接收断句模块传输过来的片段,对每个片段提取频谱特征及梅尔倒谱系数,并在其上进行处理后提取片段特征;
S5 接收特征提取模块生成的片段特征,通过机器学习算法对情感预测模型进行训练,并利用集成算法对每个模型的预测结果进行集成,
所述步骤S1中降噪预处理包括:
S11 输入一个有损的数据,利用有损数据进行训练学习;
S12 将未被损坏的数据作为深度学习算法的输出;
S13 根据训练好的模型对其他有损数据进行处理;
所述步骤S3中利用机器学习算法将片段分类,并根据分类对说话人进行识别包括:
S31利用不同建模方法将录音数据中的不同片段和语音帧分为两类或者多类;
S32对各个模型的分类结果进行集成;
所述步骤S4中在频谱特征及梅尔倒谱系数上进行处理后提取片段特征包括:
S41将各个模型根据其建模需要提取各类不同的特征指标;
S42对梅尔倒谱系数的不同维度指标进行加工处理生成识别特征;
S43通过原始语音时域信号,以及其转换生成的语谱图进行图像特征的提取;
所述步骤S5中对情感预测模型进行训练,并利用集成算法对每个模型的预测结果进行集成包括:
S51将训练样本利用提取出来的各类特征,输入到不同的机器学习算法模型中进行训练学习;
S52将各个模型训练后得到的不同预测结果进行集成;
S53通过调整不同模型得到不同应用场景下预测效果最终的整体模型,利用最终的整体模型预测其他未知的片段情感。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京创景咨询有限公司;徐心,未经北京创景咨询有限公司;徐心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811186572.8/1.html,转载请声明来源钻瓜专利网。