[发明专利]一种基于维基百科双向链接的词语语义相关度判断方法有效
申请号: | 201811108647.0 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109325230B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 朱新华;郭青松;张兰芳;陈宏朝 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/216;G06F16/30 |
代理公司: | 南宁东智知识产权代理事务所(特殊普通合伙) 45117 | 代理人: | 巢雄辉;汪治兴 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于维基百科双向链接的词语语义相关度判断方法,对于任意两个词语有:S1.在维基百科数据资源库中分别获取两个词语的定位页面;S2.若定位页面为内容页面,即是义项页面,转S3;若定位页面为消歧页面,进行消岐处理,转S3;S3.计算出两个词语每一个义项页面的概念语义解释,概念语义解释为一个双向链接向量;S4.计算两个词语义项页面间的双向链接向量的余弦,获得每一对义项概念间的语义相关度,将最大值作为两个词语的语义相关度。本发明把维基百科中页面的入链接和出链接作为页面特征,构建描述概念语义的特征向量模型,并结合一种基于社会认知度的消岐策略,提高了基于维基百科链接的词语语义相关度计算的准确度。 | ||
搜索关键词: | 一种 基于 百科 双向 链接 词语 语义 相关 判断 方法 | ||
【主权项】:
1.一种基于维基百科双向链接的词语语义相关度判断方法,其特征在于:对于任意的两个词语word1和word2的语义相关度,通过以下步骤进行判断:S1.在维基百科数据资源库中分别获取两个词语的定位页面;S2.若步骤S1获得的定位页面属于内容页面,则定位页面即是义项页面,此时该词语的义项页面序列数目为1,转步骤S3;若定位页面属于消歧页面,则先使用消岐算法进行消岐处理,获得多个义项页面,然后转步骤S3;S3.计算出两个词语每一个义项页面的基于维基百科双向链接向量的概念语义解释,所述概念语义解释定义为一个维基百科双向链接向量Vc,该向量由两种类型的加权链接组成,即概念c的加权外链接和加权内链接;S4.通过步骤S3计算的结果,计算两个词语义项页面间的双向链接向量的余弦,从而获得两个词语的每一对义项概念间的语义相关度,并将其中的最大值作为word1和word2的语义相关度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811108647.0/,转载请声明来源钻瓜专利网。