[发明专利]一种面向关系数据库的本体模型构造方法及系统有效
申请号: | 201810456743.8 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108733793B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 赵俊峰;王亚沙;王江涛;崔达;王丰 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/25;G06F16/28 |
代理公司: | 11200 北京君尚知识产权代理有限公司 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向关系数据库的本体模型构造方法及系统。该方法包括以下步骤:1)提取关系数据库的元信息;2)对提取的关系数据库的元信息进行冗余信息检测;3)对提取的关系数据库的元信息进行外键检测;4)通过映射规则,将冗余信息检测、外键检测之后的元信息用本体来表达,得到本体模型。本发明在构造本体模型的过程中加入了“冗余信息检测”和“外键检测”两个步骤,分别用于检测存在的冗余信息以及缺失的外键定义,可以更加高效地通过关系型数据库建立本体模型;建立的本体模型可以为底层的数据库构建统一的视图,为上层应用提供统一的接口,从而方便数据的应用与分析。 | ||
搜索关键词: | 关系数据库 冗余信息 元信息 键检测 检测 模型构造 关系型数据库 数据库构建 构造本体 上层应用 映射规则 统一 应用 分析 | ||
【主权项】:
1.一种面向关系数据库的本体模型构造方法,其特征在于,包括以下步骤:/n1)提取关系数据库的元信息;所述关系数据库的元信息包括表、列及约束;/n2)对提取的关系数据库的元信息进行冗余信息检测;采用以下四种规则中的一种或多种来进行冗余信息检测:实例判定法、时间判定法、关联判定法、后缀判定法;所述实例判定法通过计算表和列的实例数量来判断冗余性;所述时间判定法通过表的最近活跃时间进行冗余信息检测;所述关联判定法将不存在关联关系的表作为冗余信息;所述后缀判定法通过表的后缀进行冗余信息检测;/n3)对提取的关系数据库的元信息进行外键检测;所述进行外键检测,首先找出所有符合包含关系的列对,然后使用机器学习中的分类器方法来判断一个包含关系是否是外键关系;/n所述分类器方法包括三个步骤:特征提取、训练集构造、模型训练;/n4)通过映射规则,将冗余信息检测、外键检测之后的元信息用本体来表达,得到本体模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810456743.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种实体关系抽取方法
- 下一篇:一种基于关键词编辑的人工搜索引擎优化方法