[发明专利]一种数据表的分类方法和装置在审
申请号: | 201510490712.0 | 申请日: | 2015-08-11 |
公开(公告)号: | CN106708835A | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 李晓菲 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 英属开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据表 分类 方法 装置 | ||
技术领域
本发明涉及数据处理领域,特别是涉及一种数据表的分类方法和装置。
背景技术
云计算平台上保存有大量的数据表(table)。数据表中保存的数据可以是从各个系统中采集来的日志数据、交易数据、用户数据等,数据表可以由用户上传或提供到云计算平台以便起到共享等作用。用户可以在云计算平台上查找所需的数据表。
目前大数据的广泛应用使得云计算平台上保存的数据表的数量指数级增长。用户在云计算平台上查找数据表时,符合查询关键词(key word)的数据表会有很多,而且通过查询关键词展示给用户的数据表的质量可能良莠不齐,即使是有经验的用户也需要消耗大量时间找到所需的数据表并鉴别数据表的质量,导致用户需要花费3到5个小时甚至几天的时间才可能从海量的查询结果中找到真正适合自身需求的数据表。
发明内容
为了解决上述技术问题,本发明提供了一种数据表的分类方法和装置,从数据表中判断出高质量的数据表,并在查询过程中,将查询结果中的高质量数据表优先展示,提高了查询效率。
本发明实施例公开了如下技术方案:
一种数据表的分类方法,所述方法包括:
服务器获取第一数据表的表参数,所述表参数包括完整性参数和更新参数,所述完整性参数用于标识所述第一数据表的元数据完整性,所述更新参数用于标识所述第一数据表的更新记录;
所述服务器判断所述表参数是否符合第一判断条件;
若所述表参数符合所述第一判断条件,所述服务器将所述第一数据表的标识更新为第一标识;
所述服务器接收查询请求,所述查询请求包括查询条件;
若符合所述查询条件的多个数据表中包括所述第一数据表,所述服务器根据数据表的标识向所述查询请求展示所述多个数据表;其中,所述第一数据表的展示位置优于第二数据表的展示位置,所述第二数据表为所述多个数据表中的一个数据表,所述第二数据表的标识不是所述第一标识。
可选的,所述表参数还包括类目参数、变更频率参数和数据指令控制DQC参数中的任意一种或多种的组合,所述类目参数用于标识所述第一数据表的所属的分类,所述变更频率参数用于标识所述第一数据表中字段的变更频率和/或第一数据表的变更频率,所述DQC参数用于标识所述第一数据表被DQC监控的参数。
可选的,若所述表参数包括所述类目参数,所述服务器根据数据表的标识向所述查询请求展示所述多个数据表,还包括:
所述服务器将所述多个数据表按照类目参数进行分类展示,其中,所述第一数据表展示在所述第一数据表所属的分类下。
可选的,所述服务器判断所述表参数是否符合第一判断条件,还包括:
若所述表参数不符合所述第一判断条件,所述服务器将所述第一数据表的标识更新为第二标识;
若符合所述查询条件的多个数据表中包括所述第一数据表,所述服务器根据数据表的标识向所述查询请求展示所述多个数据表,包括:
第三数据表的展示位置优于所述第一数据表的展示位置,所述第三数据表为所述多个数据表中的一个数据表,所述第三数据表的标识是所述第一标识。
可选的,若所述表参数不符合所述第一判断条件,还包括:
所述服务器判断所述表参数是否符合第二判断条件,所述第二判断条件的符合条件低于所述第一判断条件的符合条件;
若所述表参数不符合所述第二判断条件,所述服务器将所述第一数据表的标识更新为第三标识;
所述若符合所述查询条件的多个数据表中包括所述第一数据表,所述服务器根据数据表的标识向所述查询请求展示所述多个数据表,包括:
所述服务器在展示所述多个数据表的过程中屏蔽所述第一数据表。
可选的,
所述第一判断条件包括所述完整性参数具有表注释、注释字段占比达到预设阈值、具有数据层次、具有数据的存储类型和具有调度周期中的任意一项或多项的组合;
所述第一判断条件还包括所述更新参数具有持续更新的更新记录。
一种数据表的分类装置,所述装置包括:
获取单元,用于获取第一数据表的表参数,所述表参数包括完整性参数和更新参数,所述完整性参数用于标识所述第一数据表的元数据完整性,所述更新参数用于标识所述第一数据表的更新记录;
判断单元,用于判断所述表参数是否符合第一判断条件;若所述表参数符合所述第一判断条件,触发第一更新单元;
所述第一更新单元,用于将所述第一数据表的标识更新为第一标识;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510490712.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种对象搜索方法、装置及服务器
- 下一篇:基于物联网的精准推送平台和推送方法