[发明专利]基于人工智能技术的数据资产管理与监测方法在审
申请号: | 201810154657.1 | 申请日: | 2018-02-23 |
公开(公告)号: | CN110163458A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 李大勇;李群英;李春;马立新;孔祥靖;刘立明;潘建宏;张凯;苑立民;张丁文;徐峰;樊家树;刘坤;胡小磊;盖飞 | 申请(专利权)人: | 徐峰;樊家树 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙) 11548 | 代理人: | 李静 |
地址: | 130012 吉林省长春市*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据资产 人工智能技术 监测 计算机应用技术 梳理 人员工作量 外部数据源 人工智能 传统企业 技术融合 数据发现 业务流程 原子数据 大数据 引擎 图谱 质量管理 管理 节约 替代 | ||
本发明涉及计算机应用技术领域,具体为基于人工智能技术的数据资产管理与监测方法。本发明的步骤包括连接外部数据源、原子数据、数据发现引擎等。本发明采用人工智能、大数据、知识图谱等多种技术融合,100%替代传统企业数据资产质量管理与监测工作,极大的提高了梳理数据资产、梳理业务流程的准确性,降低了人员工作量,节约了资源。
技术领域
本发明涉及计算机应用技术领域,具体为基于人工智能技术的数据资产管理与监测方法。
背景技术
目前,国家电网公司处理业务数据存在一些不足:
2017年公司接入数据中心的数总据量达56.95T。但数据质量不高,数据资产身份不唯一数据五花八门、乱象丛生,同一数据在不同部门有不同的标准和形式;由于数据质量差导致数据共享困难,无法有效开展跨系统大数据分析,致使海量数据资应用受限,难以支撑数据资产在业务场景的决策和应用。关键数据资产不能全寿命周期贯通,大多局限于部门最优,难以实现综合最优;对于增量数据的管理仍存在业务规则不统一、系统数据不连续的问题。这些突出问题,对深化数据资产全寿命周期管理形成了严重的制约。靠人工处理具有劳动效率低下和运营成本高等缺点。
发明内容
因此,为了克服上述的不足,本发明提供基于人工智能技术的数据资产管理与监测方法,它能够有效的解决上述问题。
本发明采取的技术方案如下:
数据资产质量管理与监测系统,包括如下步骤:
第一步:连接外部数据源,其包括结构化数据源和非结构化数据源,结构化数据源包括ERP系统、PMS系统、营销应用、人资管控、财务管控、物质管控、基建管控及GIS系统的国网业务系统;非结构化数据源包括国网非结构化平台和统一数据交换平台,统一数据交换平台包括影像信息;
第二步:对第一步中数据库涉及的数据进行分类及处理,得到原子数据,原子数据包括如下:
数据模型,数据库获取的用户表结构;
原始数据,关系数据库是按行存储的,不利用关系寻找和使用,原始数据将关系数据库的数据转为列式存储,原子数据是将列存储的数据进行数据去重压缩形成;
原子数据一,其具有结构化的特征,原子数据一是将列存储的数据进行数据去重压缩形成;
E文件数据,即电力标准调度文件格式;
原子数据二,其文本化的特征,原子数据二是从步骤一数据库获取的大文本数据以及外部文件格式数据;
原子数据三,具有图片及视频特征的数据,原子数据三是从第一步的非结构化数据源及统一数据交换平台接入的影像信息;
原子数据四,具有声音特征的数据,原子数据四是从第一步的非结构化数据源;
第三步:对第二步中的数据进行分析计算,得出数据发现引擎,数据发现引擎包括模型计算、数据识别、关系发现及流程还原;第二步中的数据包括原子数据一、原始数据、E文件数据、原子数据二、原子数据三、原子数据四;
模型计算的方法为:根据第二步的数据模型,利用原子数据进行内容级别的模型结果计算,主要是针对模型中文注释完整性、模型命名准确性、模型命名一致性、模型数据类型一致性、模型数据精度一致性、模型对应的数据内容是否为空、模型对应的数据量进行计算;
数据识别的方法为:使用基于高维词向量分析的深度学习算法,对数据中的往来单位、组织部门、岗位、人员、设备、物资、项目等40多类数据内容进行识别。对于识别后的数据,表示其为潜在业务主数据和公共主数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐峰;樊家树,未经徐峰;樊家树许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810154657.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理