[发明专利]一种基于多模态舆情分析的供电服务评估方法有效
申请号: | 201810055254.1 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108319666B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 沈然;王正国;胡若云;涂莹;丁麒;吴慧;颜拥;吕诗宁;谷泓杰;朱斌;何韵 | 申请(专利权)人: | 国网浙江省电力有限公司营销服务中心;国网浙江省电力有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/242;G10L15/02;G10L25/24;G10L25/63;G06Q10/06;G06Q50/06 |
代理公司: | 浙江翔隆专利事务所(普通合伙) 33206 | 代理人: | 王晓燕 |
地址: | 311100 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多模态 舆情 分析 供电 服务 评估 方法 | ||
一种基于多模态舆情分析的供电服务评估方法,涉及一种供电服务评估方法。目前,客户诉求内容以文本数据为主,其信息量大且非结构化。本发明包括以下步骤:基于增减分量法和长短时记忆网络的方法进行语音特征情感识别;基于word2vec与LSTM方式进行文本诉求分类。本技术方案将语音进行特征抽取并结合文本特征能有效地提高模型的情感识别的精度;将文本进行分词与特征抽取后,通过结合语音的特征信息,可以使模型更好地挖掘到文本诉求中有用的信息,使用带注意机制的深度循环神经网络在不同时刻注意不同的关键词,使模型更好地捕捉上下文之间的语义关系,挖掘目标文本中的时序信息以及语义信息,从而提高文本分类的准确率。
技术领域
本发明涉及一种供电服务评估方法,尤其涉及一种基于多模态舆情分析的供电服务评估方法。
背景技术
供电服务是电力供应过程中,电力企业为了满足客户获得和使用电力产品的各种相关需求而做出的服务。在电力企业供电服务的质量要求随着电力体制改革的推进而不断提高的背景下,改良供电服务评估方法势在必行。而针对用户的反馈建立一种更加有效、准确的分析模型对于改良供电服务评估方法则是一个很好的切入点。因为用户提交的文本反馈与语音反馈是企业了解客户、挖掘客户诉求并据此改进服务的重要渠道。其中,相对于客户诉求的文本数据而言,语音数据包含有多维度的情感信息,如语速、声调和音量等。这些多维度的情感信息使得语音数据更能反映出用户的真实情感。而客户诉求内容以文本数据为主,其具有信息量大和非结构化的特点。
现有的语言情感分析与识别系统以及文本诉求挖掘系统基于传统的机器学习算法,非常依赖于人工提取的特征,因此存在特征提取的瓶颈。而基于全连接神经网络的方法也存在参数太多、无法利用数据中时间序列信息等问题。与深度神经网络相比,循环神经网络有序贯记忆性,这种能力的重要性在语言理解显得尤为突出,因为语言理解需要首先理解语境,而在理论上,深度循环神经网络可以记住很长窗口的信息。其次,深度循环神经网络可以端到端训练,不依赖于人工提取的特征,适合处理非结构化的客户诉求内容。特别地,基于注意力机制的神经网络成为了最近神经网络研究的一个热点。和传统深度循环神经网络相比,通过基于word2vec与LSTM的神经网络,模型可以在不同地时刻注意到不同的关键词,从而模型可以更好地捕捉上下文间的语义关系,挖掘客户诉求文本中的时序信息以及语义信息,提高最终诉求类别的准确率。
语音信号的特征表达是提取音频信号中具有辨识性成分,例如MFCC特征,然后送入情感识别模块完成情感的判断。然而MFCC特征并没有考虑同一帧梅尔(Mel)滤波结果相邻系数之间的关系以及同一帧梅尔(Mel)滤波结果同一系数相邻帧之间的关系,这样可能会丢失语谱图中较多有用的信息。并且MFCC特征参数在语音识别中对于中、高频信号的识别精度不高。因此采用增减分量法计算MFCC、Mid-MFCC和IMFCC各阶倒谱分量对语音情感识别的贡献,提取3个特征参数贡献最高的几阶倒谱分量组成新的特征参数提高语音情感识别率显得尤为重要。针对客户诉求的文本分类任务,通常采用决策树、KNN(K-NearestNeighbor)算法、支持向量机等,但决策树存在忽略数据集中属性之间的相关性及过度拟合等问题;KNN算法输出的可解释性不强;支持向量机对缺失数据敏感、对非线性问题没有通用的解决方案等。
发明内容
本发明要解决的技术问题和提出的技术任务是对现有技术方案进行完善与改进,提供一种基于多模态舆情分析的供电服务评估方法,以达到准确进行供电服务客户的语音情感分析与识别以及客户文本诉求的目的。为此,本发明采取以下技术方案。
一种基于多模态舆情分析的供电服务评估方法,包括以下步骤:
1)基于增减分量法和长短时记忆网络的方法进行语音特征情感识别,具体步骤包括:
11)对语音数据提取MFCC、IMFCC、Mid-MFCC语音特征;
12)采用增减分量法求出上述特征参数中倒谱分量对情感识别的贡献;将特征参数中对识别率贡献最高的几阶系数组合到一起,构成新的特征参数IMF-M-MFCC;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司营销服务中心;国网浙江省电力有限公司,未经国网浙江省电力有限公司营销服务中心;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810055254.1/2.html,转载请声明来源钻瓜专利网。