[发明专利]复杂语义增强异构信息网络表示学习方法和装置有效
申请号: | 202011351571.1 | 申请日: | 2020-11-27 |
公开(公告)号: | CN112182511B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 胡艳丽;何春辉;方阳;彭娟;张鹏飞 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06N3/04;G06N3/08 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 邱轶 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 语义 增强 信息网络 表示 学习方法 装置 | ||
本申请涉及一种复杂语义增强异构信息网络表示学习方法和装置。所述方法包括:抽取异构信息网络蕴含的元图;根据元图引导在异构信息网络中进行随机游走,以得到异构信息网络中节点转移至其邻居节点的转移概率,进而得到语义路径集合;查询语义路径集合中包含共享节点的两条路径,当共享节点对应的节点类型满足预设条件,则将两条路径在所述共享节点处进行级联;当级联后的路径达到预设长度或者任意两条路径没有共享节点时,长程语义路径挖掘终止,导出长程语义路径集合;根据长程语义路径集合,进行异构信息网络的表示学习。采用本方法能够利用到更加丰富的语义信息,提升异构信息网络表示学习的性能和效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种复杂语义增强异构信息网络表示学习方法和装置。
背景技术
现实世界中系统往往由大量类型多样、相互联系的部分构成。近年来,采用网络视角对系统进行建模,为了便于处理,通常只抽取类型相同的节点和联系、采用同质信息网络对系统进行建模,如作者合作网络、论文引用网络等,往往难以同时描述不同类型的节点及其连接,造成信息损失。而事实上,作者通过论文建立合作关系,论文之间具有引用关系,不同类型的节点和联系可以共同构成更丰富的异构信息网络。
为了充分利用网络中丰富的节点类型及其关系,由不同类型节点及其联系构成的异构信息网络逐渐成为研究的热点。例如由论文及其所含术语、撰写作者、发表地,由演员、电影、导演等不同类型节点及联系构成的异构信息网络。
最近,在处理网络表示学习方面有一些成果。DeepWalk首先生成随机游走,然后在该游走上应用Skip-gram来生成嵌入。Node2vec提出了一种偏向随机游走生成方法,以使用Skip-gram模型更好地探索网络的结构信息。但是,这两种方法随机生成序列,而忽略了丰富的语义信息。
发明内容
基于此,有必要针对上述技术问题,提供一种能够解决表达学习时忽略丰富语义信息的复杂语义增强异构信息网络表示学习方法、装置、计算机设备和存储介质。
一种复杂语义增强异构信息网络表示学习方法,所述方法包括:
从文本数据中提取异构信息网络,抽取所述异构信息网络蕴含的元图;所述异构信息网络包括:节点、节点类型、节点间关系以及关系的类型;
根据所述元图引导在所述异构信息网络中进行随机游走,以得到所述异构信息网络中节点转移至其邻居节点的转移概率;
根据所述转移概率,得到语义路径集合;所述语义路径集合中包括:多条由不同类型节点和关系组成的语义路径;
查询所述语义路径集合中包含共享节点的两条路径,如果所述共享节点对应的节点类型属于给定节点类型,则将两条路径在所述共享节点处进行级联;如果所述共享节点对应的节点类型不属于给定节点类型,并且根据给定节点类型压缩得到的路径相似度超过阈值,则将两条路径在所述共享节点处进行级联;
当级联后的路径达到预设长度或者任意两条路径没有共享节点时,长程语义路径挖掘终止;长程语义路径集合中包括:随机游走生成的语义路径和挖掘得到的长程语义路径;
根据所述长程语义路径集合,进行异构信息网络的表示学习。
在其中一个实施例中,还包括:根据所述元图,计算节点类型
根据所述异构信息网络,计算节点与邻居节点类型之间的关系数量,得到根据所述异构信息网络在第
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011351571.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据记录方法及装置
- 下一篇:一种智能锁用电源的控制系统