[发明专利]一种基于超图超边匹配的分子网络分类方法及系统在审
申请号: | 202110378057.5 | 申请日: | 2021-04-08 |
公开(公告)号: | CN113033691A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 陈子健;李荣华;秦宏超;王国仁 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 冯静 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 超图 匹配 分子 网络 分类 方法 系统 | ||
本发明公开了一种基于超图超边匹配的分子网络分类方法及系统。包括:获取多个分子网络的超图;超图包括有标签超图和无标签超图;对有标签超图和无标签超图进行超边扩展,得到有标签图和无标签图;通过图遍历的方法对有标签图和无标签图中每个结点生成深度子树;得到有标签子树集合和无标签子树集合;采用超边采样方法进行多次采样,得到多个有标签匹配边集和多个无标签匹配边集;根据有标签子树集合、无标签子树集合、多个有标签匹配边集和多个无标签匹配边集,计算有标签超图和无标签超图之间的相似度;根据有标签超图和无标签超图之间的相似度对无标签超图进行分类。本发明使用超图比较方法更容易对分子网络进行比较,从而对分子网络进行分类。
技术领域
本发明涉及分子网络分类领域,特别是涉及一种基于超图超边匹配的分子网络分类方法及系统。
背景技术
随着信息技术的发展,图数据在生活中处处皆是,例如:社交网络、引文网络、金融风险网络等等。对图的聚类分析是网络分析中的一个基础问题,例如:对不同分子网络进行聚类、分类,从而识别分析出化学药物的药性和毒性,在金融风险网络中对子图进行分类,识别子网络是否是洗钱、担保借贷等异常行为。超图是传统图的一种推广,在超图中,边不再是二元关系的连接,也就是边不再是只连接两个点,而是一个可以包含多个节点的集合。这种推广扩展了传统图的局限性。在蛋白质分子网络中,往往会出现两种以上的蛋白质分子交互作用,使用超图则更容易表示。
现有的分类技术包括基于图核的方法以及基于图神经网络的方法等等。基于图核的方法往往是根据分子网络建立的图,采用一些传统的模型对其进行分类,比较常见的有基于k-核分解比较图相似度的方法,并在此基础上进行分类。基于图神经网络的方法,往往是将分子网络形成的图的特征作为输入,根据图神经网络的训练迭代,再加上一层全连接层作为分类层从而得到分类结果,常用的图神经网络有图卷积网络和图注意力网络等等。但是这些方法都是基于传统图的,受限于图中边的二元结构,不能够更好地表达分子网络中的多元作用关系。
发明内容
本发明的目的是提供一种基于超图超边匹配的分子网络分类方法及系统,使用超图的比较方法更容易对分子网络进行比较,从而对分子网络进行分类。
为实现上述目的,本发明提供了如下方案:
一种基于超图超边匹配的分子网络分类方法,包括:
获取多个分子网络的超图;所述超图包括有标签超图和无标签超图;
对所述有标签超图和所述无标签超图进行超边扩展,得到有标签图和无标签图;
通过图遍历的方法对有标签图和无标签图中每个结点生成深度子树;得到有标签子树集合和无标签子树集合;
采用超边采样方法进行多次采样,得到多个有标签匹配边集和多个无标签匹配边集;
根据有标签子树集合、无标签子树集合、多个有标签匹配边集和多个无标签匹配边集,计算有标签超图和无标签超图之间的相似度;
根据有标签超图和无标签超图之间的相似度对无标签超图进行分类。
进一步地,所述超边扩展包括星扩展和团扩展。
进一步地,所述根据有标签子树集合、无标签子树集合、多个有标签匹配边集和多个无标签匹配边集,计算有标签超图和无标签超图之间的相似度,具体包括:
计算有标签子树集合和无标签子树集合中相同子树的深度;
根据所述深度计算每一个有标签匹配边集和每一个无标签匹配边集的相似度;
对所有有标签匹配边集和所有标签匹配边集的相似度求平均得到有标签超图和无标签超图之间的相似度。
进一步地,所述根据所述深度计算每一个有标签匹配边集和每一个无标签匹配边集的相似度,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110378057.5/2.html,转载请声明来源钻瓜专利网。