[发明专利]一种基于上下文相关性的抽象概念实例化方法有效
申请号: | 201910974114.9 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110874395B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 王振杰;王元斌;刘俊涛;张毅;王军伟;高子文 | 申请(专利权)人: | 中国船舶重工集团公司第七0九研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/9535;G06F40/211;G06F40/289;G06K9/62 |
代理公司: | 深圳市六加知识产权代理有限公司 44372 | 代理人: | 向彬 |
地址: | 430000 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 上下文 相关性 抽象 概念 实例 方法 | ||
1.一种基于上下文相关性的抽象概念实例化方法,其特征在于,该方法具体步骤如下:
(1)输入数据集、抽象概念及对抽象概念的上下文语境约束描述;
(2)数据预处理:从所述数据集中抽取实例的并列关系集合,根据百科分类结构构建分类关系树;
(3)种子实例抽取:依据给定的抽象概念从输入数据集的文本语料中获取高可信度的种子实例;
(4)实例相似网络构建:以种子实例为核心,根据并列关系集合计算候选实例之间的关联相似权重,根据分类关系树计算候选实例和种子实例之间的类别相似权重,并依据候选实例之间的类别相似性和关联相似性构建候选实例相似网络;
(5)候选实例类别预测:基于实例相似网络,利用带有偏好的随机游走算法计算候选实例属于给定抽象概念的概率;
(6)实例相关性度量:基于获取的新闻语料库,利用文档模型计算约束语境与实例的相关性;
(7)输出实例化结果集:根据步骤(5)中候选实例属于抽象概念的概率以及步骤(6)中约束语境与实例的相关性,计算抽象概念实例化概率,并根据所述抽象概念实例化概率输出实例化结果集。
2.根据权利要求1所述的一种基于上下文相关性的抽象概念实例化方法,其特征在于,所述步骤(4)中实例相似网络构建的过程如下:
对实例相似网络的定义如下:ISN={E,LE,RE},其中,E={ei|i=1,2,…,n}是顶点集,表示抽象概念的候选实例集;LE和RE分别是E中元素之间的类别和关联相似性的加权边,L=[l(ei,ej)]n×n表示LE的类别相似权重矩阵;R=[r(ei,ej)]n×n表示RE的关联相似性权重矩阵。
3.根据权利要求2所述的一种基于上下文相关性的抽象概念实例化方法,其特征在于,实例对ei和ej的类别相似权重计算如下:
其中,d(ei,c)表示候选实例ei在分类关系树中与抽象概念c的最短路径的长度;d(ej,c)表示候选实例ej在分类关系树中与抽象概念c的最短路径长度,和分别是实例ei和ej的百科分类标签集合,在类别相似性计算中的分类关系树由百科标签迭代构建而成。
4.根据权利要求2或3所述的一种基于上下文相关性的抽象概念实例化方法,其特征在于,候选实例和种子实例的关联相似权重计算如下:
其中,ei∈E,es∈Sc,Sc是由模板匹配出的抽象概念c的种子实例,count(es,ei)表示包含实例ei和es的并列关系集合数量;其中,并列关系集合通过提取汉语句子中具有并列关系的实体获得,表示包含实例es的并列关系集合的总数,如果ei和ej均不是种子实例,则r(ei,ej)被初始化为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七0九研究所,未经中国船舶重工集团公司第七0九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974114.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种牛仔风格面料的制作工艺
- 下一篇:结构化日志数据的加工方法和装置