[发明专利]数据源的处理方法、装置及智能分析平台在审
申请号: | 202010241184.6 | 申请日: | 2020-03-31 |
公开(公告)号: | CN113468379A | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 薛昭瑜 | 申请(专利权)人: | 上海依图网络科技有限公司 |
主分类号: | G06F16/90 | 分类号: | G06F16/90 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 徐颖聪 |
地址: | 200051 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据源 处理 方法 装置 智能 分析 平台 | ||
1.一种数据源的处理方法,其特征在于,包括:
获取多种数据源;
对多种所述数据源进行统计分析,并得到所述数据源中的数据信息;
根据各种所述数据信息并结合预定的分类逻辑,对各种所述数据源设置标准化的元数据列表;
基于该数据信息和标准化的元数据列表作为样本集训练得到标准的数据查询引擎;
将多种数据源提取到标准化的数据查询引擎,所述多种数据源通过标准化的数据查询引擎进行处理,得到汇总后的标准化的数据源。
2.根据权利要求1所述的方法,其特征在于,所述数据源包括:文件、网页、关系型数据库、时序数据库、分析型数据库、实时消息队列和数据提取接口中的一种或多种。
3.根据权利要求1所述的方法,其特征在于,所述元数据列表中包括:数据源中的各个数据字段的类型、范围、含义和分布的一种或多种。
4.根据权利要求1所述的方法,其特征在于,所述预定的分类逻辑,包括:
判断所述数据信息是否符合设定属性的阈值;
当判断所述数据信息符合设定属性的阈值时,则将所述数据信息归为该属性,并将所述属性记录在所述标准化的元数据列表中。
5.一种数据源的处理装置,其特征在于,包括:
获取模块,用于获取多类数据源;
分析模块,用于对各种所述数据源进行统计分析,并得到所述数据源中的数据信息;
处理模块,用于根据各种所述数据信息并结合预定的分类逻辑,对各种所述数据源设置标准化的元数据列表;
所述处理模块基于该数据信息和标准化的数据源列表作为样本集训练得到标准的数据查询引擎;
提取模块,用于将多类数据源提取到标准化的数据查询引擎,并通过标准化的数据查询引擎进行处理,得到汇总后的标准化的数据源。
6.根据权利要求5所述的装置,其特征在于,所述数据源包括:文件、网页、关系型数据库、时序数据库、分析型数据库、实时消息队列或数据提取接口。
7.根据权利要求5所述的装置,其特征在于,所述元数据列表包括:数据源中的各个数据字段的类型、范围、含义和分布的一种或多种。
8.根据权利要求5所述的装置,其特征在于,所述处理模块具体用于:
判断所述数据信息是否符合设定属性的阈值;
当判断所述数据信息符合设定属性的阈值时,则将所述数据信息归为该属性,并将所述属性记录在所述标准化的元数据列表中。
9.一种智能分析平台,其特征在于,包括权利要求5-8任一项所述的数据源的处理装置。
10.一种电子设备,其特征在于,包括:处理器;和存储器,在所述存储器中存储有计算机程序指令,
其中,在所述计算机程序指令被所述处理器运行时,使得所述处理器执行权利要求1-4任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海依图网络科技有限公司,未经上海依图网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010241184.6/1.html,转载请声明来源钻瓜专利网。