[发明专利]一种基于图神经网络的电网业务对话数据情感检测方法在审
申请号: | 202110817827.1 | 申请日: | 2021-07-20 |
公开(公告)号: | CN113656564A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 李妍;孟洁;何金;赵迪;张倩宜;张旭;孙轶凡;吴凯;包磊 | 申请(专利权)人: | 国网天津市电力公司;国家电网有限公司;国网天津市电力公司信息通信公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/211;G06F40/30;G06Q30/00 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王来佳 |
地址: | 300010*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 电网 业务 对话 数据 情感 检测 方法 | ||
1.一种基于图神经网络的电网业务对话数据情感检测方法,其特征在于:包括以下步骤:
步骤1、提取对话集,构建语句级的自影响和互影响关系图以及特征提取模型;
步骤2、构建词级无向图以及特征提取模型;
步骤3、构建主题词汇与上下文词之间的关系无向图以及特征提取模型;
步骤4、融合步骤1、步骤2和步骤3中的语句级特征、词图特征以及主题词汇与上下文词之间的关系特征,并计算对话情感。
2.根据权利要求1所述的一种基于图神经网络的电网业务对话数据情感检测方法,其特征在于:所述步骤1的具体步骤包括:
(1)将单个语句表示为节点,构建图G(S,E),S为所有语句集合,E表示所有语句之间的连边关系集合,一对节点/语句之间的边表示这些语句的说话人之间的影响关系,以及它们在会话中的相对位置;
(2)在自影响关系建模中,设置可变窗口,通过注意力机制提取从第一个窗口到第L个窗口语句间的权重值βi作为连边关系值,自影响关系语句节点嵌入表示hself为:
同样得到互影响关系中节点的嵌入表示hinter为:
(3)基于以上两种权值关系构建邻接矩阵,自影响邻接矩阵和互影响邻接矩阵分别表示为BA、BB,通过图卷积网络的互影响特征提取表达式为:
HS(A→B)和HS(B→A)分别表示对话双方之间的影响,l为图卷积网络的层数,W为超参数矩阵;
(3)客服和用户双方的语句自影响关系特征提取表达分别为:
(4)基于客服和用户对话过程中的互影响和自身语句之间的影响,得到对话最终特征表示为:
3.根据权利要求1所述的一种基于图神经网络的电网业务对话数据情感检测方法,其特征在于:所述步骤2的具体步骤包括:
(1)针对句子S,设W是句子S中所有词的集合,构造图G(W,E),使得任意wi,wj∈W,eij∈E代表词wi和wj之间的连边;在图G中,句子中的任何一个词都被认为是一个单顶点,通过设置多种可变窗口,针对不同窗口大小时采用点互信息PMI来衡量两个词语之间的语义关系作为连边的权值为:
(2)对于不同窗口大小的设置,得到不同边权值的大小,并通过加权融合得到一个词语另一个词的关系邻接矩阵A,其中aij=mkeij,mk为不同大小的窗口,k=2,…10为窗口个数;
(3)将构建的词级图G中的A作为图卷积网络的输入,特征提取方法公式为:
HW=σ(AHlWl)。
4.根据权利要求1所述的一种基于图神经网络的电网业务对话数据情感检测方法,其特征在于:所述步骤3的具体方法为:
采用序列标注方法提取上下文所涉及到的主题词表示为Wt=(wt1,wt2,…wtr),r=1,2,…R为主题词汇出现的个数,通过基于图注意力机制的方法提取特征,其中主题词汇与上下文词之间权值αti,得到主题词汇的表示向量为:
5.根据权利要求1所述的一种基于图神经网络的电网业务对话数据情感检测方法,其特征在于:所述步骤4的具体方法为:
基于以上得到词共现关系,语句自影响和互影响关系,以及对话涉及的主题词汇与上下文词之间的影响关系进行特征提取后,通过全连接操作得到最终的嵌入表示为:
最后通过softmax函数识别客服的情感状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网天津市电力公司;国家电网有限公司;国网天津市电力公司信息通信公司,未经国网天津市电力公司;国家电网有限公司;国网天津市电力公司信息通信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110817827.1/1.html,转载请声明来源钻瓜专利网。