[发明专利]一种用于计算机大数据的高效批量处理方法在审

专利信息
申请号: 202010446557.3 申请日: 2020-05-25
公开(公告)号: CN113722081A 公开(公告)日: 2021-11-30
发明(设计)人: 赵芳;张丽凤 申请(专利权)人: 新乡学院
主分类号: G06F9/50 分类号: G06F9/50;G06F16/27;G06F16/215;G06F16/26;G06F11/14
代理公司: 北京中仟知识产权代理事务所(普通合伙) 11825 代理人: 田江飞
地址: 453000 河*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 计算机 数据 高效 批量 处理 方法
【权利要求书】:

1.一种用于计算机大数据的高效批量处理方法,其特征在于:所述方法包括以下步骤:

步骤一:通过数据采集系统采集用户数据,将采集到的文本、音频、视频以及图片数据导入至大型的分布式数据库中并进行备份源数据;

步骤二:对采集到的数据通过数据分类模块进行分类;

步骤三:对分类后的数据进行数据预处理,消除异常数据,并收集异常数据;

步骤四:通过处理模块对正常数据进行批量处理,将预处理好的数据通过各自的处理器进行处理,处理器处理时基于数据类型选择合适的大数据模型并调用,利用数据对模型进行计算,对模型参数优化和调整,优化完成后,通过优化后的若干个大数据模型对正常数据进行处理,当某一个处理器完成数据处理后,通过进度检测模块检测其他处理器的处理进度,然后使已完成处理任务的处理器协助处理进度最慢的处理器工作,同样的,当第二个处理器完成数据处理后,通过进度检测模块检测其他处理器的处理进度,然后使已完成处理任务的处理器协助处理进度最慢的处理器,直至所有数据处理完毕;

步骤五:在对正常数据处理的同时对异常数据亦进行处理,处理方式同步骤四;

步骤六:处理好的正常数据和异常数据分布式存储在存储单元内,加密上传至云端,实现数据共享,并通过模型优化模块进一步对大数据模型进行优化,得到更加适合该用户数据的模型;

步骤七:对处理好的正常数据和异常数据分别进行可视化处理,得到相应的可视化的报表。

2.根据权利要求1所述的一种用于计算机大数据的高效批量处理方法,其特征在于,所述步骤一中数据采集系统具体的采集方法包括:通过传感器、摄像头和其他智能终端自动采集信号、图片或录像来获取数据;通过网络爬虫或网站公开API等方式从网站上获取数据;通过导入历史数据库数据或对接第三方数据库数据。

3.根据权利要求1所述的一种用于计算机大数据的高效批量处理方法,其特征在于,所述步骤二中数据分类过程具体包括:按照类别属性将采集到的数据分成文本、音频、视频以及图片四类,然后依据数据类型选择不同的方法,如定序分类法、定距分类法或定比分类法将每一类的数据再分成若干个小类。

4.根据权利要求1所述的一种用于计算机大数据的高效批量处理方法,其特征在于,所述步骤三中数据预处理具体包括:基于统计模型估计缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来清理数据;通过平滑聚集、数据概化、规范化等方式将数据转换成适用于数据处理的形式。

5.根据权利要求1所述的一种用于计算机大数据的高效批量处理方法,其特征在于,所述步骤六中大数据模型优化的具体步骤包括:评估模型,通过留出法、N拆交叉验证法或过拟合法对常用指标如AUC、KS、误差率、错误率等进行计算;优化模型,根据计算的常用指标数值调整模型、优化公式、优化算法,得到适合该用户的最优大数据模型。

6.根据权利要求1所述的一种用于计算机大数据的高效批量处理方法,其特征在于,所述步骤七中数据的可视化处理具体包括:处理好的数据根据数据的类型选择合适的图表并绘制成相应的二维或三维图形,所述二维图形包括柱状图、散点图、饼图、雷达图等动态交互的图形,所述三维图形包括3D航线图、3D散点图、3D柱图等3D动态图形,且该数据可视化处理过程亦可根据用户使用需求进行定制化的服务,如语音播报功能,处理好的数据经分析后得出最后的结论,并通过语音播报单元形成语音,以便用户收听。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新乡学院,未经新乡学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010446557.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top