[发明专利]用于标记数据的方法、装置及其服务系统有效
申请号: | 201911352052.4 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111061742B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 王燕忠 | 申请(专利权)人: | 北京数起科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2455;G06F40/117;G06F40/30 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 李波;柯正怡 |
地址: | 100088 北京市西城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 标记 数据 方法 装置 及其 服务 系统 | ||
本发明涉及一种用于标记数据的方法、装置、数据服务系统及其计算机可读存储介质。所述数据服务系统包括数据库和语义库,所述数据库包括多个数据表而所述语义库包括多个字段规则,所述方法包括:判断所述数据表中的字段是否存在对应的字段名称;当判断所述字段不存在对应的字段名称时,根据所述字段查找所述语义库中的字段规则,以确定与所述字段规则相关联的字段名称;以及将确定的所述字段名称标记至所述数据表。通过本发明可以确认数据表中字段的类型并加上对应的字段名称,以加速后续数据的速度和准确度。
技术领域
本发明一般地涉及数据库技术领域。更具体地,本发明涉及一种通过数据服务系统执行数据标记的方法、装置、服务系统及其计算机可读存储介质。
背景技术
面对越来越庞大的数据和多样的数据来源,如何准确且快速的进行数据识别是数据库技术领域里相当重要的课题。然而,现有数据库在读取或整合多个数据表前,通常需要花费相当长的时间来进行数据表的识别操作。目前,针对数据表识别的作法是先确认数据表中的备注栏是否已经有被写入内容。如果数据表的字段没有预先在备注栏中写入与有关数据表的字段对应的备注内容,则必须要通过人工去进行查找并加注。即便有些数据表内的字段已带有备注,但也有可能因为备注的语法未统一,以至于存在有些字段虽然具有相同属性但却有不同备注的情形发生。由于前述原因,可能会造成数据识别的困难度或错误率增加。
发明内容
为了至少部分地解决背景技术中提到的技术问题,本发明的方案提供了一种通过数据服务系统执行数据标记的方法、装置、系统及其计算机可读存储介质。
在一个方面中,本发明提供通过数据服务系统执行数据标记的方法,其中所述数据服务系统包括数据库和语义库,所述数据库包括多个数据表而所述语义库包括多个字段规则,所述方法包括:判断所述数据表中的字段是否存在对应的字段名称;当判断所述字段不存在对应的字段名称时,根据所述字段查找所述语义库中的字段规则,以确定与所述字段规则相关联的字段名称;以及将确定的所述字段名称标记至所述数据表。
在一个实施例中,所述语义库包括常规语义库或行业语义库,并且其中所述字段名称包括用于表达所述字段的属性或类型的信息。
在一个实施例中,上述方法进一步包括:在所述常规语义库或行业语义库中确定与所述数据表和字段具有不同相似度的多个相似数据表和字段;从所述多个相似数据表和字段中选取一个作为参考数据表和字段;以及将与所述参考数据表和字段关联的字段名称标记到所述数据表。
在另一个实施例中,所述字段规则还包括对所述字段名称的说明和字段规则的描述中的至少一个,并且所述数据表包括用于写入所述字段名称的备注栏。
在又一个实施例中,查找所述语义库中的字段规则包括利用自然语言处理技术来查找所述语义库中的字段规则。
在又一个实施例中,上述方法进一步包括:当判断所述字段存在对应的字段名称时,根据所述字段查找所述语义库中的字段规则;判断所述对应的字段名称是否符合所述字段规则;以及当判断所述对应的字段名称不符合所述字段规则,则以与所述字段规则相关联的字段名称更新所述对应的字段名称。
在另一方面中,本发明提供应用于数据服务系统的数据标记装置,其中所述数据服务系统包括数据库,该数据库包括多个数据表,所述数据标记装置包括:语义库,其配置成存储多个字段规则;判断模块,其配置成判断所述数据表中的字段是否存在对应的字段名称;确定模块,其配置成根据所述字段查找所述语义库中的字段规则,以确定与所述字段规则相关联的字段名称;以及标记模块,其配置成将确定的所述字段名称标记至所述数据表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京数起科技有限公司,未经北京数起科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911352052.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑用地修复装置
- 下一篇:一种聚丙烯纤维增强3D打印复合材料的制备方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置