[发明专利]一种基于图网络池化的新闻文本分类方法有效
申请号: | 202011386651.0 | 申请日: | 2020-12-02 |
公开(公告)号: | CN112487187B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 朱小草;郭春生;陈华华;应娜 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/194;G06N3/04;G06K9/62 |
代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 新闻 文本 分类 方法 | ||
1.一种基于图网络池化的新闻文本分类方法,其特征在于,包括步骤:
S1.在注意力机制中将结构信息与特征信息相结合,并计算图神经网络中一阶邻域内节点之间的相似性得分,得到具有相似性节点的注意力机制;
S2.采用稀疏概率激活函数sparsemax算法将得到的注意力机制进行稀疏化,得到节点相对应的集群;
S3.采用局部聚合卷积计算每个集群的分数,并通过得分高低来判断集群所含有的信息量;
S4.采用topk选出得分最高的前个集群,并将选择出的集群进行重新连边得到最终池化后的神经网络;
步骤S2中采用稀疏概率激活函数sparsemax算法将得到的注意力机制进行稀疏化后还包括得到稀疏的概率分布,表示为:
其中,si为ei进行归一化后的向量,ei表示节点i的注意力值,ei=[ei,1,ei,2,...ei,N];表示维度为N-1的单纯形;
步骤S3中采用局部聚合卷积计算每个集群的分数中局部聚合卷积表示为:
其中,激活函数σ采用sigmoid;N(i)、N(j)分别表示节点i、节点j的邻域;表示能学习参数,考虑了集群的全局和局部重要性,综合得出每个集群的分数;表示第i个节点的特征变换;表示当前节点与其一阶邻域内的节点差值。
2.根据权利要求1所述的一种基于图网络池化的新闻文本分类方法,其特征在于,步骤S1中得到具有相似性节点的注意力机制,表示为:
ei,j=σ(we[xi||xj]T)+λ·ai,j
其中,σ表示激活函数;表示权重向量;和分别奥斯节点i和节点j的特征向量;||表示拼接操作;表示当前图的邻接矩阵;ai,j表示A的第i行第j列的值。
3.根据权利要求1所述的一种基于图网络池化的新闻文本分类方法,其特征在于,所述得到稀疏的概率分布中还包括:
定义拉格朗日函数:
最优解集满足下列KKT条件:
若j∈{1,...,N},有si,j*>0,则μi,j*=0,有
令c(ei)={z∈{1,...,N}|si,z*>0},有则
稀疏的概率分布的对偶形式表示为:
si,j=sparsemax(ei,j)=[ei,j-τ(ei)]+
其中,[x]+=max{0,x};τ(·)表示阈值函数。
4.根据权利要求1所述的一种基于图网络池化的新闻文本分类方法,其特征在于,其特征在于,步骤S4具体为:
将适应度向量Φ=[φ1,φ2,...,φN]T与集群表示矩阵SX相乘,以使适应度函数fφ能学习:
其中⊙表示哈达玛积;S=[s1,s2,...,sN]鄙视集群分配矩阵;X=[x1,x2,...,xN]T表示特征矩阵;
函数TOPk(·)对适应度得分进行排序,并以比率k进行筛选保留,得出Gc中前个所选集群的索引表示为:
通过选择前个群集来形成池化图Gp,则对应的分配矩阵和节点特征矩阵表示为:
对集群进行了采样后,池化图Gp中用和来获得新的邻接矩阵Ap:
其中,I表示单位矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011386651.0/1.html,转载请声明来源钻瓜专利网。