[发明专利]一种在大数据集群中处理深度学习任务的方法及装置在审
申请号: | 202011298646.4 | 申请日: | 2020-11-19 |
公开(公告)号: | CN112257677A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 汪金玲 | 申请(专利权)人: | 汪金玲 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 长沙正务联合知识产权代理事务所(普通合伙) 43252 | 代理人: | 郑隽;吴婷 |
地址: | 410000 湖南省长沙市*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 集群 处理 深度 学习 任务 方法 装置 | ||
本发明涉及一种大数据的技术领域,揭露了一种在大数据集群中处理深度学习任务的方法,包括:将海量图像数据存储到大数据集群中,对所存储的海量图像数据进行图像灰度化的灰度拉伸的预处理;利用基于闪电连接过程优化算法的聚类算法对大数据集群中的存储图像数据进行聚类划分;利用静态优化策略进行子数据集的提取,将所提取的子数据集作为深度学习任务的训练集;利用改进后的点锐度算法评价训练集中图像数据的清晰度,并利用高通滤波对清晰度较低的图像进行锐化处理;利用改进的SSD深度学习模型进行深度学习任务。本发明还提供了一种在大数据集群中处理深度学习任务的装置。本发明实现了大数据集群中的深度学习任务的处理。
技术领域
本发明涉及大数据的技术领域,尤其涉及一种在大数据集群中处理深度学习任务的方法及装置。
背景技术
随着社会技术的飞速发展,互联网已经在人们的日常生活和工作中得到了非常广泛的应用,在访问互联网应用和获取需要的信息的同时,也相应产生了大量的数据,这些数据以PB级速度迅速上升,人们开始迈入大数据时代。同时随着数据量的快速增长,由于深度学习技术会随着训练数据的增长而具备更好的效果,慢慢代替了传统机器学习技术,而如何利用大数据进行深度学习任务成为当前领域的热门话题。
当前大部分的大数据集群存在随着访问控制策略的不断增加,大数据集群中的数据无法删除,大数据集群平台的存储压力会逐渐增大的问题,从而影响后续数据的管理、查询和使用效率。
鉴于此,如何对大数据集群进行改进,并利用改进后的大数据集群进行深度学习任务的处理,成为本领域技术人员亟待解决的问题。
发明内容
本发明提供一种在大数据集群中处理深度学习任务的方法,通过利用基于闪电连接过程优化算法的聚类算法对大数据集群中的存储数据集进行聚类划分,并提出一种静态优化策略,利用所述静态优化策略进行划分数据集的提取,从而利用所提取的划分数据集进行深度学习任务的实现。
为实现上述目的,本发明提供的一种在大数据集群中处理深度学习任务的方法,包括:
获取海量图像数据,并将海量图像数据存储到大数据集群中,从而对所存储的海量图像数据进行图像灰度化的灰度拉伸的预处理;
利用基于闪电连接过程优化算法的聚类算法对大数据集群中的存储图像数据进行聚类划分,得到若干子数据集;
利用静态优化策略进行子数据集的提取,将所提取的子数据集作为深度学习任务的训练集;
利用改进后的点锐度算法评价训练集中图像数据的清晰度,并利用高通滤波对清晰度较低的图像进行锐化处理;
根据训练集中的图像数据,训练得到改进的SSD深度学习模型,并利用改进的SSD深度学习模型进行深度学习任务。
可选地,所述获取海量图像数据,并将海量图像数据存储到大数据集群,并进行图像灰度化的灰度拉伸的预处理,包括:
获取海量用于深度学习任务的数据,在本发明一个具体实施例中,所述深度学习任务为基于深度学习的人脸识别任务,因此本发明获取海量图像数据,所述图像数据包含3/4的人脸图像,以及1/4的非人脸图像;
将所述海量图像数据存储到大数据集群中,在本发明一个实施例中,所述大数据集群包括Hadoop数据库以及Spark计算引擎;
利用灰度化算法以及灰度拉伸算法对大数据集群中的海量图像数据进行预处理,所述预处理流程为:
1)通过对所存储的图像中每一个像素的三个分量求最大值,并将该最大值设置为该像素点的灰度值,得到存储图像的灰度图,所述灰度化处理的公式为:
G(i,j)=max{R(i,j),G(i,j),B(i,j)}
其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汪金玲,未经汪金玲许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011298646.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种垃圾回收总成
- 下一篇:一种齿轮咬合活动关节装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置