[发明专利]分类合并的方法及装置、存储介质有效
申请号: | 201910512956.2 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110232088B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 陈矛;杨宗凯;刘三女牙;吴超 | 申请(专利权)人: | 华中师范大学 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/35 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 宋朋飞 |
地址: | 430000 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 合并 方法 装置 存储 介质 | ||
1.一种分类合并的方法,其特征在于,包括:
获取目标分类与多个源分类,所述目标分类和所述源分类均为基于树的层级结构,每个分类由多个概念以及概念之间的语义关系构成;
确定每个所述源分类中与所述目标分类中的概念具有相等语义的概念,并根据所述具有相等语义的概念和所述源分类中概念间的层级关系,将所述源分类中的概念分为核心概念与非核心概念;
根据所述核心概念与所述目标分类中的概念具有的语义关系和所述核心概念的层级关系,将所述核心概念并入到所述目标分类中,得到初始的合并分类;
根据所述非核心概念的语义特征和所述非核心概念在源分类中的层级关系,将所述非核心概念并入到所述初始的合并分类中,得到最终的合并分类。
2.根据权利要求1所述的方法,其特征在于,根据所述核心概念与所述目标分类中的概念具有的语义关系和所述核心概念的层级关系,将所述核心概念并入到所述目标分类中,得到初始的合并分类,包括:
根据所述核心概念与所述目标分类中的概念具有的语义关系和所述核心概念的层级关系,将所述核心概念并入到所述目标分类中,合并具有相等语义的概念,得到基于图的分类,所述分类中包括所述核心概念具有的语义关系和附属的资源;
将所述基于图的分类划分为多个块;
根据每个块中概念的语义特征及概念间的层级关系,确定每个块中概念之间的语义关系;
根据每个块中概念间的语义关系,移除每个块中概念间的冗余语义以及概念间的多继承关系,得到所述初始的合并分类。
3.根据权利要求2所述的方法,其特征在于,将所述基于图的分类划分为多个块,包括:
确定所述图中待遍历的概念;
依次访问所述待遍历的概念,确定图中的汇点,所述汇点是具有相等语义的概念合并得到的概念且所述汇点至少有两个父概念;
确定出所述汇点的各个父概念分别对应的搜索路径;
针对每个汇点,沿每条所述搜索路径从对应的父概念向上搜索,确定汇集所有所述搜索路径的源点,所述汇点到所述源点之间的所有路径以及所述所有路径上的概念为一个块。
4.根据权利要求2所述的方法,其特征在于,根据每个块中概念的语义特征及概念间的层级关系,确定每个块中概念之间的语义关系,包括:
根据概念的语义特征及概念间的层级关系建立每个块中概念之间的语义关系,所述语义关系包括上位关系、相等关系以及下位关系;
对所述概念之间的语义关系进行转换、合并或者删除。
5.根据权利要求4所述的方法,其特征在于,对所述概念之间的语义关系进行转换、合并或者删除,包括:
确定两个概念之间的语义关系为上位关系时,将所述两个概念的上位关系转换为下位关系;或
确定两个概念之间的语义关系为相等关系时,将所述两个概念按照预设规则合并为一个概念;或
确定两个概念之间的语义关系为下位关系,且所述两个概念之间具有更丰富的语义关系能够表示所述下位关系时,将所述下位关系删除。
6.根据权利要求2所述的方法,其特征在于,根据每个块中概念间的语义关系,移除每个块中概念间的冗余语义以及概念间的多继承关系,包括:
确定每个块中具有多继承关系的概念,所述具有多继承关系的概念具有至少两个父概念;
确定每个所述具有多继承关系的概念和所述具有多继承关系的概念的后代概念的主题分布;
确定所述具有多继承关系的概念的各个父概念的主题分布;
根据所述后代概念的主题分布和所述父概念的主题分布计算所述后代概念与每个所述父概念的主题相似度;
保留与所述后代概念的主题相似度最大的父概念与所述具有多继承关系的概念之间的下位关系,移除其它所述父概念与所述具有多继承关系的概念之间的下位关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910512956.2/1.html,转载请声明来源钻瓜专利网。