[发明专利]一种全息科技数据处理方法在审
申请号: | 201910145268.7 | 申请日: | 2019-02-27 |
公开(公告)号: | CN109919469A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 王乐;曲翠钰;杜长彬 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/10;G06Q50/26 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 全息 科技数据 数据处理 清洗 科技项目管理 科技管理 科技项目 来源数据 模型设计 全息数据 软件架构 生命周期 数据分析 数据融合 信息资源 有效整合 职能部门 重要数据 梳理 融合 挖掘 贯穿 保证 | ||
1.一种全息科技数据处理方法,其特征在于,
主要包括四个步骤:
1)全息科技数据梳理与描述;
2)全息科技数据模型设计
3)全息科技数据清洗;
4)全息科技数据数据融合。
2.根据权利要求1所述的方法,其特征在于,
其中,1)全息科技数据梳理与描述
在科技项目信息数据服务的基础上,建立科技数据分类体系,将业务分成需求征集、重点任务布局、实施方案编制、专项设立、编制项目指南、合规性审核、答辩评审、正式申报、首轮评审、预申报、指南发布、立项结果公示、项目立项、预算经费监管、项目绩效评估、项目成果管理、项目成果转化、科技成果推广宣传、科技奖励阶段;
通过上述梳理,将科技项目管理业务归为项目、机构、人员、产出、环境、条件、事件和项目管理过程这八类要素。
3.根据权利要求2所述的方法,其特征在于,
2)全息科技数据模型设计
按照上述构成科技数据的八要素,设计科技全息数据模型。
4.根据权利要求3所述的方法,其特征在于
3)全息科技数据清洗
数据清洗包括清除重复数据、消除噪声数据。
5.根据权利要求4所述的方法,其特征在于
其中,重复数据的清洗:
如果有两个及以上的实例表示的是同一实体,那么即为重复记录。为了发现重复实例,将每一个实例都与其他实例进行对比,找出与之相同的实例;对于实例中的数值型属性,采用统计学的方法来检测,根据不同的数值型属性的均值和标准方差值,设置不同属性的置信区间来识别异常属性对应的记录,识别出数据集合中的重复记录,并加以消除;
相似度计算是重复数据清洗过程中的常用方法,通过计算记的各属性的相似度,再考虑每个属性的不同权重值,加权平均后得到记录的相似度;
如果两条记录相似度超过了设定的阈值,则认为两条记录是匹配的,否则,认为这两条记录指向不同实体。
6.根据权利要求4或5所述的方法,其特征在于
噪声数据处理:
在数据收集、整理的过程中,产生的噪声数据,即“离群点”;通过值域及文本语义理解判定数据内容值的合理性并修订。
7.根据权利要求6所述的方法,其特征在于
对于数值型数据采用平滑数据的方法,文本内容采用语义判断-相似文本替换的方法。
8.根据权利要求8所述的方法,其特征在于
4)全息科技数据数据融合
数据集成是将多文件或多数据库运行环境中的异构数据进行合并处理,解决语义模糊性;该部分主要涉及数据的选择、不一致数据的处理问题。
9.根据权利要求8所述的方法,其特征在于
数据选择指不同来源信息对实体的同一属性进行描述时做的选择;
根据算法矩阵用于判定不同数据源的内容权重值,根据最后权重值计算最终的内容项。
10.根据权利要求9所述的方法,其特征在于
当内容适合使用数据选择矩阵时,可以进行权重计算,数据重构。
当内容不适用数据选择矩阵时,分别对数据源进行数据质量评估,依据数据质量评估矩阵进行数据内容重构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910145268.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:股票投资风险评估方法、装置及设备
- 下一篇:客资信息的分发方法及装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理