[发明专利]一种面向硬件实现的GBDT分类模型压缩方法在审
申请号: | 201710892740.4 | 申请日: | 2017-09-27 |
公开(公告)号: | CN107797973A | 公开(公告)日: | 2018-03-13 |
发明(设计)人: | 梅魁志;王晓;吴杰;赵海波;薛建儒;郑南宁;赵英海;高凡 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06N99/00 |
代理公司: | 西安通大专利代理有限责任公司61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种面向硬件实现的GBDT分类模型压缩方法,该方法引入自定义剪枝、自定义编码以及自定义寻址来实现模型结构上、参数上及寻址上的压缩,以此来降低模型的存储空间。在提取构建模型的必须参数后,对其中的预测值value数据进行近似,并在此基础上对于模型中的每棵决策树进行剪枝;对剪枝后的模型进行自定义寻址,并将寻址信息记入相应节点的参数信息当中;同时,对于模型中的每一组节点信息进行二进制组合编码后按序存入其类别对应的数组即实现了对GBDT分类模型的压缩。利用位运算读取节点编码中存储的参数信息即可实现模型重建。对原始模型的剪枝、模型参数的编码以及模型寻址过程的改变,使模型在硬件系统中的存储占用得到大幅降低。 | ||
搜索关键词: | 一种 面向 硬件 实现 gbdt 分类 模型 压缩 方法 | ||
【主权项】:
一种面向硬件实现的GBDT分类模型压缩方法,其特征在于,包括以下步骤:步骤一:解析OpenCV训练所得GBDT分类模型的xml文件以提取每个节点的深度depth、分叉split、属性var、阈值le以及预测值value的信息;步骤二:将value近似为整数并对原模型中的树进行剪枝;步骤三:按出现顺序排列构成模型的决策树,对每棵树按照深度depth由浅到深的顺序排布其节点,令其根节点位置为零,记录树内所有节点较根节点的相对位置,并据此给出所有非叶子节点的左子节点位置add;叶子节点的左子节点由下一棵树的根节点较当前根节点的相对位置替代;步骤四:将阈值le转换为整数,并将分叉split、属性var、阈值le、预测值value以及节点位置add编写为定长二进制码;步骤五:对于每个非叶子节点,按分叉split、属性var、阈值le以及节点位置add的顺序将其数据编为一组码字;对于每个叶子节点,按分叉split、补0、预测值value、节点位置add的顺序将其数据编为一组与非叶子节点等长的码字;而后将节点码字按地址顺序排布成树,并将树按照在原模型中出现的先后次序存入相应类别对应的数组中;步骤六:利用位运算读取节点编码中存储的分叉split、属性var、阈值le、预测值value以及节点位置add的信息,实现分类模型的重建。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710892740.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种城市设计暴雨雨型统计方法
- 下一篇:报表的显示处理方法及网页报表服务器