[发明专利]一种改进的本体概念词汇语义相似度求解方法在审
申请号: | 201610833134.0 | 申请日: | 2016-09-20 |
公开(公告)号: | CN106610939A | 公开(公告)日: | 2017-05-03 |
发明(设计)人: | 金平艳 | 申请(专利权)人: | 四川用联信息技术有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610054 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 改进 本体 概念 词汇 语义 相似 求解 方法 | ||
1.一种改进的本体概念词汇语义相似度求解方法,本发明涉及语义网络技术领域,具体涉及一种改进的本体概念词汇语义相似度求解方法,其特征是,包括如下步骤:
步骤1:初始化统计方法模块
步骤2:将待比较词输入初始化统计方法模块中
步骤3:将待比较词映射到本体概念模块中
步骤4:分别选取待比较词对应深度最大的本体概念
步骤5: 计算待比较词对应深度最大的两本体概念间距离
步骤6:待比较词之间的词形相似度
步骤7:综合上述步骤,计算两待比较词的相似度。
2.根据权利要求1中所述的一种改进的本体概念词汇语义相似度求解方法,其特征是,以上所述步骤5中的具体计算过程如下:
步骤5:计算待比较词对应深度最大的两本体概念间距离,需先求两本体概念间义原项的相似度,再计算两本体概念间相对深度,具体计算过程如下:
5.1)两本体概念间义原项的相似度
设对应深度最大的本体概念中含有n个义原,即,对应深度最大的本体概念中含有m个义原,即
分别两两计算与中义原的相似度,即,可以得与中义原项相似度矩阵如下:
根据上述矩阵找出每个行向量中义原平均相似度即
最后得到两本体概念间义原项的相似度如下:
由于两本体概念间距离与义原项的相似度成反比,所以对进行归一化处理,即得
为光滑系数,具体由用户指定
5.2)计算两本体概念间相对深度
上式为对应深度最大的本体概念在模块中的深度值,同理 为对应深度最大的本体概念在模块中的深度值,这个根据模块可以很容易得出
5.3)计算待比较词对应深度最大的两本体概念间距离
上式A+B=1,A、B分别为的权重比例,这个由专家给出
对进行归一化处理,即
上式可以通过非线性回归迭代估计确定。
3.根据权利要求1中所述的一种改进的本体概念词汇语义相似度求解方法,其特征是,以上所述步骤6中的具体计算过程如下:
步骤6:待比较词之间的词形相似度需先知词长相似率与词性相似率,其具体计算过程如下:
6.1)词长相似率
6.2)词性相似率
上式为待比较词中词性相似个数,len为词的长度,为的长度
6.3) 待比较词之间的词形相似度
。
4.根据权利要求1中所述的一种改进的本体概念词汇语义相似度求解方法,其特征是,以上所述步骤7中的具体计算过程如下:
步骤7:综合上述步骤,计算两待比较词的相似度其具体计算过程如下:
上式为权重因子,当时,两本体概念间距离对相似度的影响较大,否则,词形相似度对相似度的影响较大,根据经验可得,前者对影响更大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川用联信息技术有限公司,未经四川用联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610833134.0/1.html,转载请声明来源钻瓜专利网。