[发明专利]简化基于矩阵的Boosting算法的系统及方法有效
申请号: | 201010231583.0 | 申请日: | 2010-07-20 |
公开(公告)号: | CN102117380A | 公开(公告)日: | 2011-07-06 |
发明(设计)人: | 李政宪 | 申请(专利权)人: | 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518109 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 简化 基于 矩阵 boosting 算法 系统 方法 | ||
技术领域
本发明涉及一种数据处理技术,尤其涉及一种简化基于矩阵的Boosting算法的系统及方法。
背景技术
随着人类收集和存储数据能力的快速提升,各行各业利用计算机技术对数据进行分析的需求日趋迫切。机器学习作为智能数据分析的重要技术手段,受到人们越来越多的关注,已成为计算机科学技术领域中最活跃的研究分支之一。所谓机器学习是研究如何让计算机具备和人类一样的学习能力,以使计算机具有决策、推理、认知、识别等智能,以便利用已知数据(样本、实例等)和一定的学习规则,对未知或无法测量的数据进行预测和判断。
Boosting算法是目前流行的一种机器学习算法,其主要用于对目标物体的侦测,如人脸识别等方面,可以提高回归算法的性能。Boosting算法可以从已知数据中识别出特征数据。通过对特征数据的各种组合运算,经过不断的侦错与迭代,逐渐减少对预测结果或者判断结果的假阳值(false positive,也称误判率),从而获得较为精确的预测结果或者判断结果。
Boosting算法可以通过多种方法实现,如决策数、加权最小二乘法等。其中,像加权最小二乘法这样的基于矩阵的Boosting算法最为简单并且能够在很短的时间得到相对精确的预测结果或者判断结果。然而,这种基于矩阵的Boosting算法需要对所有的特征数据进行矩阵运算,因此,运算次数会根据特征数据的增加而增加,从而运算所需的时间及内存空间也会随之增加。
发明内容
鉴于以上内容,有必要提出一种简化基于矩阵的Boosting算法的系统,其通过对数据的分割运算,简化基于矩阵的Boosting算法,以减少运算次数。
此外,还有必要提出一种简化基于矩阵的Boosting算法的方法,其通过对数据的分割运算,简化基于矩阵的Boosting算法,以减少运算次数。
一种简化基于矩阵的Boosting算法的系统,包括:参数接收模块,用于从一个用户端电脑接收假阳值;数据载入模块,用于从一个数据库中载入已知数据,并从所载入的已知数据中识别出特征数据,以生成一个由特征数据组成的特征集合;数据分割模块,用于将上述特征集合分割成多个包含数据个数相等的子集合;编号指定模块,用于依序为每个子集合指定一个编号;编号组合组成模块,用于从上述子集合的编号中随机选择编号,以生成多组编号组合,其中,每一组编号组合包含N个不相同的编号;选择模块,用于从上述接收的假阳值中选择其中一个假阳值;数据选取模块,用于从上述所生成的多组编号组合中选择其中一组编号组合,从而选取所选择的组编号组合中包括的编号所对应的子集合中的数据;Boosting算法运算模块,用于根据上述选取的数据组成一个矩阵,并利用Boosting算法对该矩阵进行运算,从而计算出所选择的编号组合对应的假阳值;编号组合选取模块,用于在每一组编号组合都已经计算出其对应的假阳值的情况下,将计算出来的所有假阳值按照大小依次排列,从值小的一端按次序取出n个假阳值,并获取该n个假阳值对应的n组编号组合;比较模块,用于将该n个假阳值与上述选择的假阳值进行比较,以判断该n个假阳值中的最小值是否小于所选择的假阳值;及记录模块,用于在上述n个假阳值中的最小值小于所选择的假阳值的情况下,将该n个假阳值中的最小值记录为该次Boosting运算的假阳值,并记录该最小值所对应的编号组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司,未经鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010231583.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:发动机进气气流控制组件
- 下一篇:大跨度型钢梁拔杆整体提升施工方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用