[发明专利]一种全息科技数据处理方法在审
申请号: | 201910145268.7 | 申请日: | 2019-02-27 |
公开(公告)号: | CN109919469A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 王乐;曲翠钰;杜长彬 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10;G06Q50/26 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全息 科技数据 数据处理 清洗 科技项目管理 科技管理 科技项目 来源数据 模型设计 全息数据 软件架构 生命周期 数据分析 数据融合 信息资源 有效整合 职能部门 重要数据 梳理 融合 挖掘 贯穿 保证 | ||
本发明提供一种全息科技数据处理方法,属于软件架构技术领域,本发明主要包括四个步骤:1)全息科技数据梳理与描述;2)全息科技数据模型设计;3)全息科技数据清洗;4)全息科技数据数据融合。有效整合政府各职能部门的科技管理信息资源,建立贯穿科技项目管理生命周期全过程的科技项目全息数据模型,实现不同来源数据清洗、融合,作为数据分析、挖掘前的重要数据准备工作,可以保证数据的准确性和有效性。
技术领域
本发明涉及软件架构技术,尤其涉及一种全息科技数据处理方法。
背景技术
随着“以用户为中心、以服务为导向”的政府形态的提出,对分散在政府各职能部门的科技项目资源进行有效的梳理和整合,设计科技全息数据模型,对于全面掌握项目生命周期全过程的信息,为用户提供个性化、精细化和移动化的服务。
因为数据类型和组织模式多样化、关联关系繁杂、质量良莠不齐等内在的复杂性,使得数据的感知、表达、理解和计算等多个环节面临着巨大的挑战。
发明内容
为了解决以上技术问题,本发明提出了一种全息科技数据处理方法,结合各类科技信息资源,设计全息科技数据模型,对数据模型进行系列处理,提高数据的准确性。
本发明的技术方案是:
一种全息科技数据处理方法,主要包括四个步骤:
1)全息科技数据梳理与描述;
2)全息科技数据模型设计
3)全息科技数据清洗;
4)全息科技数据数据融合。
其中,1)全息科技数据梳理与描述
在科技项目信息数据服务的基础上,建立科技数据分类体系,将业务分成需求征集、重点任务布局、实施方案编制、专项设立、编制项目指南、合规性审核、答辩评审、正式申报、首轮评审、预申报、指南发布、立项结果公示、项目立项、预算经费监管、项目绩效评估、项目成果管理、项目成果转化、科技成果推广宣传、科技奖励阶段;
通过上述梳理,将科技项目管理业务归为项目、机构、人员、产出、环境、条件、事件和项目管理过程这八类要素。
2)全息科技数据模型设计
按照上述构成科技数据的八要素,设计科技全息数据模型;
3)全息科技数据清洗
数据清洗包括清除重复数据、消除噪声数据。
其中,重复数据的清洗:
如果有两个及以上的实例表示的是同一实体,那么即为重复记录。为了发现重复实例,将每一个实例都与其他实例进行对比,找出与之相同的实例;对于实例中的数值型属性,采用统计学的方法来检测,根据不同的数值型属性的均值和标准方差值,设置不同属性的置信区间来识别异常属性对应的记录,识别出数据集合中的重复记录,并加以消除;
相似度计算是重复数据清洗过程中的常用方法,通过计算记的各属性的相似度,再考虑每个属性的不同权重值,加权平均后得到记录的相似度;
如果两条记录相似度超过了设定的阈值,则认为两条记录是匹配的,否则,认为这两条记录指向不同实体。
噪声数据处理:
在数据收集、整理的过程中,产生的噪声数据,即“离群点”;通过值域及文本语义理解判定数据内容值的合理性并修订。
对于数值型数据采用平滑数据的方法,文本内容采用语义判断-相似文本替换的方法。
4)全息科技数据数据融合
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910145268.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:股票投资风险评估方法、装置及设备
- 下一篇:客资信息的分发方法及装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理