[发明专利]一种基于人工神经网络的水系实体语义相似性度量方法在审

专利信息
申请号: 201610119650.7 申请日: 2016-03-03
公开(公告)号: CN105808689A 公开(公告)日: 2016-07-27
发明(设计)人: 陈占龙;徐永洋;龚希;叶文;张丁文 申请(专利权)人: 中国地质大学(武汉)
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27;G06N3/04;G06N3/08
代理公司: 武汉华旭知识产权事务所 42214 代理人: 刘荣;江钊芳
地址: 430074 湖*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于人工神经网络的水系实体语义相似性度量方法,从本体概念属性出发,针对语义的特征采用基于人工神经网络的空间实体语义相似性度量模型,该模型通过统计得到专家样本数据,以每组特征相似度作为神经网络输入参数,以专家给出的实体语义相似度作为预计输出参数,通过训练得到转换矩阵,用之计算需要度量的实体语义相似性。
搜索关键词: 一种 基于 人工 神经网络 水系 实体 语义 相似性 度量 方法
【主权项】:
一种基于人工神经网络的水系实体语义相似性度量方法,其特征在于包括以下步骤:(1)已知训练数据集由3对以上语义概念对组成,语义概念对中的2个语义概念均由一组属性组成,2个语义概念的属性一一对应,每个属性分别具有属性的值,每对语义概念均具有期望输出;对于每对语义概念对,执行步骤(2)至步骤(5):(2)确定训练数据集中每对属性的类型,利用以下相似度计算模型中的一种或一种以上获取训练数据集中的每对属性的相似度;(a)一般属性相似度计算模型:若一对属性为有序属性,则采用以下公式计算:sim(a1,b1)=1‑|index(a1)‑index(b1)|/m其中,sim(a1,b1)表示有序属性a1和b1的相似度,index函数用于计算属性的索引值,所述索引值为该属性的值所在区间的编号,m表示属性的值区间的数目;若一对属性为无序属性,则采用以下公式计算:<mrow><mi>s</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><msub><mi>a</mi><mn>2</mn></msub><mo>,</mo><msub><mi>b</mi><mn>2</mn></msub><mo>)</mo></mrow><mo>=</mo><mfenced open = '{' close = ''><mtable><mtr><mtd><mn>1</mn></mtd><mtd><mrow><msub><mi>a</mi><mn>2</mn></msub><mo>=</mo><msub><mi>b</mi><mn>2</mn></msub></mrow></mtd></mtr><mtr><mtd><mn>0</mn></mtd><mtd><mrow><msub><mi>a</mi><mn>2</mn></msub><mo>&NotEqual;</mo><msub><mi>b</mi><mn>2</mn></msub></mrow></mtd></mtr></mtable></mfenced></mrow>其中,sim(a2,b2)表示无序属性a2和b2的相似度;(b)枚举属性相似度计算模型:采用以下公式计算:<mrow><mi>s</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><msub><mi>a</mi><mn>3</mn></msub><mo>,</mo><msub><mi>b</mi><mn>3</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mo>|</mo><msub><mi>a</mi><mn>3</mn></msub><mo>&cap;</mo><msub><mi>b</mi><mn>3</mn></msub><mo>|</mo></mrow><mrow><mo>|</mo><msub><mi>a</mi><mn>3</mn></msub><mo>&cup;</mo><msub><mi>b</mi><mn>3</mn></msub><mo>|</mo></mrow></mfrac></mrow>其中,sim(a3,b3)表示枚举属性a3和b3的相似度,|a3∩b3|表示枚举属性中相交元素的数目,|a3∪b3|表示枚举属性中并集元素的数目;(c)结构属性相似度计算模型:采用以下公式计算:<mrow><mi>s</mi><mi>i</mi><mi>m</mi><mrow><mo>(</mo><msub><mi>a</mi><mn>4</mn></msub><mo>,</mo><msub><mi>b</mi><mn>4</mn></msub><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><msub><mi>V</mi><mi>a</mi></msub><mo>&times;</mo><msub><mi>V</mi><mi>b</mi></msub></mrow><mrow><msub><mi>V</mi><mi>a</mi></msub><mo>&CenterDot;</mo><msub><mi>V</mi><mi>b</mi></msub></mrow></mfrac></mrow>其中,sim(a4,b4)表示枚举属性a4和b4的相似度,Va和Vb为概念向量,Va×Vb表示概念向量Va和Vb的叉积,Va·Vb表示概念向量Va和Vb的点积;(d)数值型属性相似度计算模型:采用以下公式计算:sim(a5,b5)=(va‑vb)/λ其中,sim(a5,b5)表示数值型属性a5和b5的相似度,va和vb分别表示a5和b5的属性值,λ表示设置的阈值;(3)将步骤(2)计算得到的每对属性的相似度组成多维度向量(I1,I2,...,In),n为语义概念的属性的数目,所述多维度向量即语义概念对的本体属性相似度;将D={I1,I2,...,In}作为输入层I;设置隐藏层H的节点数目;(4)若转换矩阵W和转换矩阵V未进行初始化,则初始化转换矩阵W和转换矩阵V,使转换矩阵W的行数和列数分别为隐藏层H的节点数目和输出层O的节点数目,转换矩阵V的行数和列数分别为输入层I的节点数n和隐藏层H的节点数目;转换矩阵W和转换矩阵V的各元素的值初始化为‑1到1之间的随机数;否则,在步骤(5)中选用返回的转换矩阵W和转换矩阵V;(5)对D中的各元素依次执行以下步骤:(5‑1)执行以下步骤以前向传播,以得到隐藏层H和输出层O:<mrow><msub><mi>H</mi><mi>j</mi></msub><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><munder><mo>&Sigma;</mo><mi>k</mi></munder><msub><mi>V</mi><mrow><mi>j</mi><mi>k</mi></mrow></msub><msub><mi>I</mi><mi>k</mi></msub><mo>)</mo></mrow></mrow><mrow><msub><mi>O</mi><mi>i</mi></msub><mo>=</mo><mi>&sigma;</mi><mrow><mo>(</mo><munder><mo>&Sigma;</mo><mi>k</mi></munder><msub><mi>W</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><msub><mi>H</mi><mi>j</mi></msub><mo>)</mo></mrow></mrow>其中,函数Hj为隐藏层H的第j个节点,Oi为输出层O的第i个节点;(5‑2)执行以下步骤以后向传播:<mrow><msub><mi>&Delta;W</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><mo>-</mo><mi>&alpha;</mi><mfrac><mrow><mo>&part;</mo><mi>E</mi></mrow><mrow><mo>&part;</mo><msub><mi>W</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow></mfrac><mo>=</mo><mi>&alpha;</mi><mrow><mo>(</mo><mi>L</mi><mo>-</mo><msub><mi>O</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>O</mi><mi>i</mi></msub><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>O</mi><mi>i</mi></msub><mo>)</mo></mrow><msub><mi>I</mi><mi>j</mi></msub></mrow><mrow><msub><mi>&Delta;V</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mo>=</mo><munder><mo>&Sigma;</mo><mi>i</mi></munder><msub><mi>W</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><msub><mi>&Delta;W</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub><mrow><mo>(</mo><mn>1</mn><mo>-</mo><msub><mi>H</mi><mi>j</mi></msub><mo>)</mo></mrow><msub><mi>I</mi><mi>k</mi></msub></mrow>W=W+ΔWV=V+ΔV其中,ΔW表示通过后向传播之后调节转换矩阵W的变化量,ΔWij表示ΔW中的元素,ΔV表示通过后向传播之后调节转换矩阵V的变化量,ΔVij表示ΔV中的元素,Ci表示训练样本集中第i对语义概念的期望输出,α为设置的调节因子;(5‑3)通过以下公式计算每一个输出和期望输出之间的平均平方差:<mrow><mi>E</mi><mo>=</mo><mfrac><mn>1</mn><mi>n</mi></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msup><mrow><mo>(</mo><msub><mi>C</mi><mi>i</mi></msub><mo>-</mo><msub><mi>O</mi><mi>i</mi></msub><mo>)</mo></mrow><mn>2</mn></msup></mrow>如果E比设置的最好‑最小‑误差小,则神经网络完成训练,返回转换矩阵W和转换矩阵V作为两个训练矩阵,将输出层O输出;否则,返回步骤(5‑2)继续后向传播以继续训练神经网络。(6)每对语义概念对执行步骤(2)至步骤(5)后,输出层O即为最终水系实体语义相似度度量结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610119650.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top