[发明专利]用于标记数据的方法、装置及其服务系统有效

专利信息
申请号: 201911352052.4 申请日: 2019-12-25
公开(公告)号: CN111061742B 公开(公告)日: 2021-01-12
发明(设计)人: 王燕忠 申请(专利权)人: 北京数起科技有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2455;G06F40/117;G06F40/30
代理公司: 北京维昊知识产权代理事务所(普通合伙) 11804 代理人: 李波;柯正怡
地址: 100088 北京市西城*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 标记 数据 方法 装置 及其 服务 系统
【说明书】:

发明涉及一种用于标记数据的方法、装置、数据服务系统及其计算机可读存储介质。所述数据服务系统包括数据库和语义库,所述数据库包括多个数据表而所述语义库包括多个字段规则,所述方法包括:判断所述数据表中的字段是否存在对应的字段名称;当判断所述字段不存在对应的字段名称时,根据所述字段查找所述语义库中的字段规则,以确定与所述字段规则相关联的字段名称;以及将确定的所述字段名称标记至所述数据表。通过本发明可以确认数据表中字段的类型并加上对应的字段名称,以加速后续数据的速度和准确度。

技术领域

本发明一般地涉及数据库技术领域。更具体地,本发明涉及一种通过数据服务系统执行数据标记的方法、装置、服务系统及其计算机可读存储介质。

背景技术

面对越来越庞大的数据和多样的数据来源,如何准确且快速的进行数据识别是数据库技术领域里相当重要的课题。然而,现有数据库在读取或整合多个数据表前,通常需要花费相当长的时间来进行数据表的识别操作。目前,针对数据表识别的作法是先确认数据表中的备注栏是否已经有被写入内容。如果数据表的字段没有预先在备注栏中写入与有关数据表的字段对应的备注内容,则必须要通过人工去进行查找并加注。即便有些数据表内的字段已带有备注,但也有可能因为备注的语法未统一,以至于存在有些字段虽然具有相同属性但却有不同备注的情形发生。由于前述原因,可能会造成数据识别的困难度或错误率增加。

发明内容

为了至少部分地解决背景技术中提到的技术问题,本发明的方案提供了一种通过数据服务系统执行数据标记的方法、装置、系统及其计算机可读存储介质。

在一个方面中,本发明提供通过数据服务系统执行数据标记的方法,其中所述数据服务系统包括数据库和语义库,所述数据库包括多个数据表而所述语义库包括多个字段规则,所述方法包括:判断所述数据表中的字段是否存在对应的字段名称;当判断所述字段不存在对应的字段名称时,根据所述字段查找所述语义库中的字段规则,以确定与所述字段规则相关联的字段名称;以及将确定的所述字段名称标记至所述数据表。

在一个实施例中,所述语义库包括常规语义库或行业语义库,并且其中所述字段名称包括用于表达所述字段的属性或类型的信息。

在一个实施例中,上述方法进一步包括:在所述常规语义库或行业语义库中确定与所述数据表和字段具有不同相似度的多个相似数据表和字段;从所述多个相似数据表和字段中选取一个作为参考数据表和字段;以及将与所述参考数据表和字段关联的字段名称标记到所述数据表。

在另一个实施例中,所述字段规则还包括对所述字段名称的说明和字段规则的描述中的至少一个,并且所述数据表包括用于写入所述字段名称的备注栏。

在又一个实施例中,查找所述语义库中的字段规则包括利用自然语言处理技术来查找所述语义库中的字段规则。

在又一个实施例中,上述方法进一步包括:当判断所述字段存在对应的字段名称时,根据所述字段查找所述语义库中的字段规则;判断所述对应的字段名称是否符合所述字段规则;以及当判断所述对应的字段名称不符合所述字段规则,则以与所述字段规则相关联的字段名称更新所述对应的字段名称。

在另一方面中,本发明提供应用于数据服务系统的数据标记装置,其中所述数据服务系统包括数据库,该数据库包括多个数据表,所述数据标记装置包括:语义库,其配置成存储多个字段规则;判断模块,其配置成判断所述数据表中的字段是否存在对应的字段名称;确定模块,其配置成根据所述字段查找所述语义库中的字段规则,以确定与所述字段规则相关联的字段名称;以及标记模块,其配置成将确定的所述字段名称标记至所述数据表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数起科技有限公司,未经北京数起科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911352052.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top