[发明专利]一种基于多模态舆情分析的供电服务评估方法有效

专利信息
申请号: 201810055254.1 申请日: 2018-01-19
公开(公告)号: CN108319666B 公开(公告)日: 2021-09-28
发明(设计)人: 沈然;王正国;胡若云;涂莹;丁麒;吴慧;颜拥;吕诗宁;谷泓杰;朱斌;何韵 申请(专利权)人: 国网浙江省电力有限公司营销服务中心;国网浙江省电力有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F40/289;G06F40/242;G10L15/02;G10L25/24;G10L25/63;G06Q10/06;G06Q50/06
代理公司: 浙江翔隆专利事务所(普通合伙) 33206 代理人: 王晓燕
地址: 311100 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种基于多模态舆情分析的供电服务评估方法,涉及一种供电服务评估方法。目前,客户诉求内容以文本数据为主,其信息量大且非结构化。本发明包括以下步骤:基于增减分量法和长短时记忆网络的方法进行语音特征情感识别;基于word2vec与LSTM方式进行文本诉求分类。本技术方案将语音进行特征抽取并结合文本特征能有效地提高模型的情感识别的精度;将文本进行分词与特征抽取后,通过结合语音的特征信息,可以使模型更好地挖掘到文本诉求中有用的信息,使用带注意机制的深度循环神经网络在不同时刻注意不同的关键词,使模型更好地捕捉上下文之间的语义关系,挖掘目标文本中的时序信息以及语义信息,从而提高文本分类的准确率。
搜索关键词: 一种 基于 多模态 舆情 分析 供电 服务 评估 方法
【主权项】:
1.一种基于多模态舆情分析的供电服务评估方法,其特征在于包括以下步骤:1)基于增减分量法和长短时记忆网络的方法进行语音特征情感识别,具体步骤包括:11)对语音数据提取MFCC、IMFCC、Mid‑MFCC语音特征;12)采用增减分量法求出上述特征参数中倒谱分量对情感识别的贡献;将特征参数中对识别率贡献最高的几阶系数组合到一起,构成新的特征参数IMF‑M‑MFCC;13)采用长短时记忆网络将输入的IMF‑M‑MFCC特征序列分类为相应的情感类别;将获得的IMF‑M‑MFCC特征序列进行输出,经过逐层传递,捕获整个序列中的语义信息,以及综合语音序列中上下文信息,最终将这些信息逐步保留并编码成针对语音情感的高层语义用于最终的语音情感识别;2)基于word2vec与LSTM方式进行文本诉求分类,具体步骤包括:21)对客户文本诉求数据进行预处理,包括:211)处理文本编码格式问题,使用统一规范的编码,避免出现中英文乱码情况;212)去除文本的无关信息,无关信息包括标点符号,网址和表情;对所有样本数据中的文本内容进行分词;213)去除文本数据中的停用词,并将所有英文字母转换成小写;22)基于文本语料库中的词频,选择出现频率最高的词或单词组合形成词典;对于高频次的单词进行抽样来减少训练样本的个数;23)根据各词的词频建立哈夫曼树并生成节点所在的二进制码,该二进制码反映了对应节点在树中的位置;根据编码能够从根节点一步步找到对应的叶子节点;接着,初始化各非叶子节点的中间向量和叶子节点中的词向量;24)训练中间向量和词向量,即回到语料库,逐句的读取一系列的词,用梯度下降算出梯度,再更新非叶子节点处向量的词与词向量的值;由于词典的大小导致网络将会拥有大规模的权重矩阵,因此训练过程中采用负采样,使训练样本仅更新一小部分权重,降低梯度下降过程中的计算量;25)将得到的词向量作为后续LSTM网络的输入;LSTM处理短文本特征时对于由多个句子组成的客户诉求,先对文本进行分句,然后使用平均的情感值来表示该文本诉求的情感值;输入LSTM网络的则是句子中各个词汇对应的词向量;句子长度统一,不足的用零向量补齐;对于输入的词向量,用隐藏层状态hi作为其在网络中的中间表示;每一层的LSTM单元中,由遗忘门决定遗忘信息;输入门决定单元中需要更新的值,创建新的候选值,输入门、遗忘门与新的候选值一起产生新的状态;最终,由输出门决定输出的值,得到该隐藏层的状态;26)将LSTM最后一层隐藏层状态为当前输入句的表示,经过一层softmax,得到该句的情感值;重复上述步骤,将各个分句的情感值累加,取平均值作为诉求文本的情感值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司营销服务中心;国网浙江省电力有限公司,未经国网浙江省电力有限公司营销服务中心;国网浙江省电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810055254.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top