[发明专利]一种基于真-伪三连体神经网络的本体匹配方法在审
申请号: | 202211175689.2 | 申请日: | 2022-09-26 |
公开(公告)号: | CN115577117A | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 卢家伟;剡昌锋;林国祥;王江;吕明;刘斌;王瑞民 | 申请(专利权)人: | 兰州理工大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06N3/04;G06N3/08 |
代理公司: | 北京和联顺知识产权代理有限公司 11621 | 代理人: | 李麒麟 |
地址: | 730050 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 连体 神经网络 本体 匹配 方法 | ||
1.一种基于真-伪三连体神经网络的本体匹配方法,其特征在于,包括以下步骤:
S1:给定待匹配本体,从待匹配本体中提取各自具有代表性的实体,得到核心实体集,用于构建训练数据集;
S2:构建训练数据集;
S3:对训练数据集进行字符嵌入,将字符转化为可供计算机识别的字符向量;
S4:将编码好的字符向量送入真-伪三连体神经网络中进行模型训练;所述真-伪三连体神经网络采用两个循环神经网络RNN作为孪生神经网络SNN中的子网络结构,并将这两个循环神经网络RNN中的一个与长短期记忆网络LSTM一起作为伪孪生神经网络PSNN的子网络结构;
S5:将验证数据送入真-伪三连体神经网络中进行匹配;
S6:对匹配结果进行评估,验证真-伪三连体神经网络模型的有效性。
2.根据权利要求1所述的一种基于真-伪三连体神经网络的本体匹配方法,其特征在于,步骤S1的具体步骤如下:
S1-1:计算本体中实体的度中心度;所述度中心度是判定网络中实体重要性的指标,是对实体重要性的量化,一个实体的度中心度越高,该实体在本体中就越具有代表性;
所述度中心度的计算方法为实体的出度与入度之和;所述实体的出度和入度分别指在本体的子父实体关系网络中,该实体的出边条数和入边条数;
S1-2:对实体的度中心度的计算结果进行降序排序,选取排在前30%的实体作为核心实体。
3.根据权利要求1所述的一种基于真-伪三连体神经网络的本体匹配方法,其特征在于,步骤S2的具体步骤如下:
S2-1:确定核心实体之间的匹配关系,方法如下:
给定待匹配本体O1、O2和阈值T,分别任取O1和O2的同类待匹配核心实体e1和e2组成待匹配实体对,并分别取待匹配实体对的注释属性label1和label2、comment1和comment2,采用N-gram技术计算e1和e2的相似度值:s1=N-gram(label1,label2);
如果s1>T,那么e1和e2的相似度值即为s1,否则采用SimWP技术计算e1和e2的相似度值:
s2=SimWP(label1,label2)
如果s2>T,那么e1和e2的相似度值即为s2,否则采用Cosine技术计算c1和c2的相似度值:
s3=Cosine(comment1,comment2)
如果s3>T,那么e1和e2的相似度值即为s3,否则e1和e2不匹配;
S2-2:构建训练数据集,方法如下:
对待匹配本体O1和O2中的所有核心实体作笛卡尔积,并按照步骤S2-1的方法计算笛卡尔积中每个核心实体对的相似度值,相似度值大于阈值T的核心实体对将选作训练数据的正样本;作为约束,通过随机赋值的方法,将正样本中的一个实体更换为该实体所在本体的核心实体中的其它实体,进而完成负样本的构建,负样本数量和正样本数量保持一致;最终随机抽取样本数量的80%作为训练集,20%作为验证集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州理工大学,未经兰州理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211175689.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车零件加工用全自动冲压装置
- 下一篇:图案化水稻的种植方法