[发明专利]语音社交媒体的情绪传播量化方法及系统有效
申请号: | 201410760823.4 | 申请日: | 2014-12-12 |
公开(公告)号: | CN104538027B | 公开(公告)日: | 2018-07-20 |
发明(设计)人: | 戴伟辉;戴永辉;韩冬梅;胡虹智;周璇;戴杏云;赵旭东;赵卫东;徐冬溶;黄丽华;樊卫国;陈海建;王今朝 | 申请(专利权)人: | 复旦大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/16 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于信息技术领域,具体为语音社交媒体的情绪传播计算方法及系统。本发明方法包括4个步骤:社交媒体圈语音预处理;语音特征参数提取;情绪识别计算;情绪传播过程的量化。本发明系统包括4个模块,分别4个步骤的功能。本发明从语音情绪角度来计算社交媒体圈的情绪传播,通过PAD三维情感参数标记和BP神经网络建模,将社交媒体圈里情绪传播过程用数值来量化标识。本发明优点:充分考虑了语音社交媒体中短语式会话多的特征,采用间隔一定时间的方式来提取语音特征,有利于提升情绪识别准确率,以及能动态反应社交媒体圈里的情绪;提供了情绪传播过程量化图,便于直观地看到社交圈里的情绪变化。 | ||
搜索关键词: | 语音 社交 媒体 情绪 传播 计算方法 系统 | ||
【主权项】:
1.语音社交媒体的情绪传播量化方法,其特征在于,具体步骤为:步骤1:社交媒体圈语音预处理;依次包括语音素材抓取和语音素材处理两个过程,其中:语音素材抓取:通过调用GetVoiceFile()函数将社交媒体圈里的语音素材自动抓取出来,并保存到硬盘的VoiceFile目录下;语音素材处理:对抓取到的语音素材,进行语音格式预处理,即将语音文件转为wav格式的文件,该文件的采样频率是16KHz,采样位数是16bit,再对语音进行端点检测和截取,去掉首尾无效的语音段落;步骤2:语音特征参数提取;依次包括语音特征参数选择和实施特征提取两个过程,其中:语音特征参数选择:是对已完成步骤1的语音素材,选取18个语音特征参数构成语音特征参数集S(n),S(n)=[SEM,PM,SZCM,FF,NB,VS,MFCC12],其中,SEM指短时能量的平均值,PM指基音的平均值,SZCM指短时平均过零率的平均值,FF指第一共振峰的值,NB指语间停顿次数,VS指语速,MFCC12指12阶Mel频标倒谱系数;实施特征提取:是使用matlab工具软件编写的getVoiceValue()函数来提取单个语音文件的18个语音特征参数,该函数是按设定的间隔时间来对所选语音文件进行特征提取,如果该语音文件的播放时长能整除设定的间隔时间,则提取次数就是该整除数,否则,提取次数是整除数加1,提取完后将提取到的值存入VoiceValue.txt文件中;步骤3:情绪识别计算;包括:PAD三维参数的标记、BP神经网络建模和语音情感计算共三个过程,P表示愉悦,A表示激活,D表示优势;其中:PAD三维参数的标记:包括语音PAD量化调查和PAD值计算共两个过程,具体如下:语音PAD量化调查:以问卷和网络调查的方式,收集到被调查者在PAD量化调查表中对语音素材的标记值,该标记值是从愉悦、激活、优势三个维度来对语音素材进行的人工标定;PAD值计算:依照PAD归一化计算模型,对PAD量化调查表里的标记值分别计算愉悦、激活、优势三个维度上的P值、A值和D值,使得PAD三个维度的各自值均处在[‑1,1]的区间里,PAD归一化计算公式如下:式中,y是归一化的值,xk是待归一化的第k个样本值,xmax是样本值里最大值,xmin是样本值里最小值;BP神经网络建模:使用BP神经网络来对社交媒体圈里的语音素材的PAD值进行样本训练与建模,包括:网络层数的设计、神经节点的设计、传递函数和学习函数的设计共三个过程,具体如下:网络层数的设计:由于三层BP神经网络可以以任意精度逼近任意映射关系,因此网络层数选定为3,即:输入层、隐含层和输出层;神经节点的设计:输入层节点数目设置为18,即:18个语音特征参数;输出层节点设置为3,即:输出P值、A值、D值;隐含层节点数目通过经验公式 及反复训练得到,式中I为输入层节点数,O为输出层节点数,a为1到10的常数;均方误差的计算公式如下:式中,MSE是均方误差,n是输出节点的数目,s是训练的样本数目,是神经网络的期望输出值,是神经网络的实际输出值;传递函数和学习函数的设计:隐含层神经元传递函数选tansig;输出层神经元传递函数选purelin;训练函数选traingdx;学习速率初始值选0.1;动量因子的初始值选0.9;语音情感计算:使用建立好的BP神经网络,对语音PAD量化调查所获得的值,进行情感计算,并以历史语音的快乐、悲伤、愤怒、惊讶、恐惧和中立这六类基本情绪的PAD值作为参考,进行情感归类;步骤4:情绪传播过程的量化;通过记录发音时间顺序与该时段的PAD值来描述情绪传播动态过程,并通过计算极性的公式,即:VValue=0.2*Pvalue+0.8*Avalue,来计算极性,再以图形的方式给出简明的正负极性情绪传播过程量化图。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410760823.4/,转载请声明来源钻瓜专利网。