[发明专利]一种基于变分图自编码器与K-Means的科技论文聚类分析方法在审

专利信息
申请号: 202010742851.9 申请日: 2020-07-29
公开(公告)号: CN112084328A 公开(公告)日: 2020-12-15
发明(设计)人: 徐新黎;刘锐;肖云月;杨旭华;许营坤 申请(专利权)人: 浙江工业大学
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62;G06N3/04
代理公司: 杭州斯可睿专利事务所有限公司 33241 代理人: 王利强
地址: 310014 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 变分图 编码器 means 科技 论文 聚类分析 方法
【权利要求书】:

1.一种基于变分图自编码器与K-Means的科技论文聚类分析方法,其特征在于:所述方法包括如下步骤:

步骤一:把待分析的科技论文数据表示为一个引文网络G=(V,E,F),其中V={v1,v2,...,vn}为节点集合,每个节点表示一篇科技论文,节点数即科技论文总数n=|V|,E为边集合,两篇论文之间如果有引用关系,则这两篇论文的相应节点之间有一条连边,所有论文的连边关系构成一个n×n的邻接矩阵A,每个论文的关键词属性F={f1,f2,...,fm},属性数量m=|F|,所有论文的属性表示为一个n×m的属性信息特征矩阵X;

步骤二:构建一个由编码器和解码器组成的变分图自编码器,变分图自编码器的编码器为两层图卷积神经网络GCN,输入是引文网络的特征矩阵X和邻接矩阵A,通过学习节点低维向量表示的均值μ和方差σ,并采用重参数化方法对均值μ和方差σ进行采样操作,输出是节点的n×d的低维嵌入向量z,解码器的输入是节点的低维向量z,通过两两计算两点之间存在边的概率来重构图,其中2≤d≤n,输出是重构邻接矩阵

步骤三:用科技论文数据训练变分图自编码器,训练目标是最小化重构邻接矩阵和原始邻接矩阵A之间的距离度量,以及节点表示向量分布和正态分布的散度,训练完毕可以获得GCN的参数,通过GCN确定一个多维高斯分布,从这个分布采样得到节点的低维嵌入向量z;

步骤四:设置科技论文预期的划分数目,利用K-Means算法对低维嵌入向量z进行聚类,得到科技论文的划分结果;

步骤五:对科技论文的划分结果通过tSNE算法降维,并用Matplotlib绘图库进行二维的可视化展示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010742851.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top