[发明专利]面向大数据的指标分类方法在审

专利信息
申请号: 201711224719.3 申请日: 2017-11-29
公开(公告)号: CN108153815A 公开(公告)日: 2018-06-12
发明(设计)人: 吴艳林;吴志成;张军锋;王学勇;徐江涛;贾菲菲;彭新玲;高晓琼 申请(专利权)人: 北京京航计算通讯研究所
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中国兵器工业集团公司专利中心 11011 代理人: 周恒
地址: 100074 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 指标分类 大数据 预处理 海量数据 模型建立模块 数据融合模块 处理和分析 分布式算法 预处理模块 定义模块 数据分析 引擎 写入 驱动 转化 分析
【说明书】:

发明属于大数据分析技术领域,具体涉及一种面向大数据的指标分类方法,所述方法基于指标分类系统来实施,所述系统包括:预处理模块、系统定义模块、数据融合模块、模型建立模块、分布式算法引擎;所述方法包括:预处理、系统定义、对海量数据进行获取、预处理、转化和写入,建立指标分类模型、驱动指标分类模型;该方法可以在数据分析时能够科学、准确、有效的对海量数据进行处理和分析。

技术领域

本发明属于大数据分析技术领域,具体涉及一种面向大数据的指标分类方法。

背景技术

随着国际国内信息化建设的快速发展,各政府、行业、企事业单位等机构的业务数据已经呈现一种井喷式的数据增长趋势,积累了海量的用户行为数据、企业运行数据、行业运营数据、政府行政数据等,如何更好的运用这些沉淀的历史数据和正在快速增长的生产、运营数据,成为了现在政府、行业、企事业单位重点关注的问题。因此,在数据分析过程中,指标分类直接关系到数据分析结果的准确性、科学性和有效性,指标的分类已然成为一个重要的、迫在眉睫的问题。

发明内容

(一)要解决的技术问题

本发明要解决的技术问题是:如何提供一种在数据分析时能够科学、准确、有效的对海量数据进行处理和分析的面向大数据的指标分类方法。

(二)技术方案

为解决上述技术问题,本发明提供一种面向大数据的指标分类方法,所述方法基于指标分类系统来实施,所述系统包括:预处理模块、系统定义模块、数据融合模块、模型建立模块、分布式算法引擎;

所述方法包括如下步骤:

步骤1:由所述预处理模块根据业务需求分析,收集相关的信息,包括业务需求方案、技术要求方案、项目管理计划要求;

步骤2:由系统定义模块对业务类别进行分析定义、对数据分析维度进行分析、梳理和划分,对数据分析颗粒进行分析定义、对数据指标类别进行分析定义;

步骤3:由数据融合模块对海量数据进行获取、预处理、转化和写入;

步骤4:由模型建立模块建立指标分类模型;

所述指标分类模型建立包括:设定分类模型设计思想;定义分类模型;确定分类模型设计方式;

步骤5:由分布式算法引擎驱动指标分类模型;

分布式算法引擎由许多不同的算法库和算法调度元数据组成,分布式算法引擎与传统的算法引擎不同,可以根据指标分类模型的设计要求,按照分类模型设计方式的不同,将海量数据进行分类和切割,形成多个不同的算法单元,每个算法单元的调用都依赖于算法调度元数据,通过算法调度元数据的合成,将每个算法单元结果汇集,输出指标的分类结果。

其中,所述步骤2中,对业务类别进行分析定义是:在技术要求文件中技术限定的条件下,根据步骤1中需求分析,对分析的业务领域进行分析。

其中,所述步骤2中,对数据分析维度进行分析、梳理和划分是:维度即分析事物的角度,海量数据的分析维度就是根据步骤1中的需求分析,对海量数据的维度进行分析、梳理和划分。

其中,所述步骤2中,对数据分析颗粒进行分析定义是:数据分析颗粒即数据汇总的程度,数据分析颗粒就是根据步骤1中的需求分析,对海量数据的汇总程度进行分类。

其中,所述步骤2中,对数据指标类别进行分析定义是:数据指标类别即指标服务的群体类别,指标类别就是根据步骤1中的需求分析,对海量数据指标类别根据服务的群体进行分类。

其中,所述步骤3中,数据获取:与各类数据源建立获取接口,包括内部数据获取接口和外部数据获取接口。内部数据获取接口从数据仓库中获取数据,外部数据获取接口从传感器、互联网等获取数据,共同为分布式文件系统输入数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京航计算通讯研究所,未经北京京航计算通讯研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711224719.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top