[发明专利]一种基于Map/Reduce的快速支持向量数据描述方法及系统有效
申请号: | 201110443726.9 | 申请日: | 2011-12-27 |
公开(公告)号: | CN102591940A | 公开(公告)日: | 2012-07-18 |
发明(设计)人: | 庄进发;吴鸿伟;罗佳 | 申请(专利权)人: | 厦门市美亚柏科信息股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京恒都律师事务所 11395 | 代理人: | 何自刚 |
地址: | 361008 福建省厦门*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于Map/Reduce的快速支持向量数据描述方法及系统,其中方法包括:对用于支持向量数据描述的数据进行预处理,生成支持向量数据描述的训练数据集D;根据预设置的参数、由训练数据集D生成n个子数据集,预设置的参数包括训练数据集的划分个数;根据n个子数据集,生成MapReduce编程架构下的n个子分类器SVDDi=(1,......,n)的Map任务,并将Map任务交由Hadoop集群调度器进行运算;调用MapReduce编程架构下的Reduce任务进行子分类器SVDDi=(1,......,n)的合并,得到训练数据集的SVDD分类器。本发明可以在处理海量数据时,降低SVDD训练数据集的维数,加快SVDD训练速度,同时避免训练中断。 | ||
搜索关键词: | 一种 基于 map reduce 快速 支持 向量 数据 描述 方法 系统 | ||
【主权项】:
一种基于Map/Reduce的快速支持向量数据描述方法,其特征在于,包括以下步骤:对用于支持向量数据描述的数据进行预处理,生成支持向量数据描述的训练数据集D;根据预设置的参数、由所述训练数据集D生成n个子数据集,所述预设置的参数包括训练数据集的划分个数;根据所述n个子数据集,生成Map/Reduce编程架构下的n个子分类器SVDDi=(1,......,n)的Map任务,并将所述Map任务交由Hadoop集群调度器进行运算;在所述Hadoop集群调度器运算完成后,调用Map/Reduce编程架构下的Reduce任务进行子分类器SVDDi=(1,......,n)的合并,得到最后训练数据集的SVDD分类器;其中,所述i、n为自然数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门市美亚柏科信息股份有限公司,未经厦门市美亚柏科信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110443726.9/,转载请声明来源钻瓜专利网。