[发明专利]一种基于XGBoost算法的区块链产品检测方法、系统及装置在审
申请号: | 202010339755.X | 申请日: | 2020-04-26 |
公开(公告)号: | CN111598580A | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 黄步添;刘振广;焦颖颖;周伟华;陈建海 | 申请(专利权)人: | 杭州云象网络技术有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06K17/00;G06F16/951;G06K9/62;G06N20/00 |
代理公司: | 杭州五洲普华专利代理事务所(特殊普通合伙) 33260 | 代理人: | 丁少华 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 xgboost 算法 区块 产品 检测 方法 系统 装置 | ||
1.一种基于XGBoost算法的区块链产品检测方法,其特征在于,其步骤包括:
爬取互联网上区块链产品相关数据,并对所述区块链产品贴标签,根据区块链产品与欺诈属性的相互关系,提取区块链产品的相关特征属性,作为XGBoost区块链检测模型的训练样本集;
对上述爬取的区块链产品特征属性数据进行数据预处理,得到数值化训练样本集;
将所述数值化训练样本集输入利用XGBoost算法搭建的学习机器,训练区块链产品检测的XGBoost模型树;
利用所述区块链产品检测的XGBoost模型树对区块链产品进行检测。
2.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述训练区块链产品检测的XGBoost模型树,具体是从给定的区块链产品训练集构造出来一棵由特征信息组成的决策树,决策树从根节点开始选择特征,选取分裂点进行特征切分。
3.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述提取区块链产品的相关特征属性具体包括:
区块链产品公司信息公开度、区块链产品公司官网信息是否失真、区块链产品公司员工人数、区块链产品研发团队人数、区块链产品白皮书是否存在技术支撑、区块链产品白皮书内容完整度、区块链产品代码在Github是否开源、区块链产品代码更新次数、区块链代码最后更新时间、区块链产品代币比例信息、区块链产品ICO时长、区块链产品购买门槛、区块链产品交易所日均交易量、区块链产品交易月价格波动、区块链产品交易周价格波动、区块链产品交易当前价格以及区块链产品系统宕机频率。
4.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述对上述爬取互联网上区块链产品特征属性数据进行数据预处理,具体包括:
对所述训练样本集的区块链产品特征信息进行数值化处理;
查看训练样本集中是否存在缺失值,对训练样本集中缺失值进行处理,即,将缺失值记作稀疏矩阵,缺失值数据被分到稀疏矩阵的左子树和右子树中并分别计层损失,并选择损失值最小的分配方式;
对处理后的训练样本集进行对数变换,改善训练样本数据均值分布的不对称性;
通过绘制数值型特征的直方图分析特之间服从的分布,以及绘制热度图可视化特征之间的相关性;
将所述区块链产品特征属性数据分成连续特征和离散特征。
5.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述训练区块链产品检测的XGBoost模型树,具体包括:
训练基本的初级XGBoost模型;
在初级XGBoost模型参数的基础上进行参数调整、优化模型,通过交叉验证观察结果的变换,使用平均绝对误差衡量参数调节的优劣,得到最终的模型参数,基于参数得到XGBoost模型树。
6.根据权利要求5所述基于XGBoost算法的区块链产品检测方法,其特征在于,在初级XGBoost模型参数的基础上进行参数调整、优化模型,还包括:调节树的深度与节点权重,包括改变构建树的深度max_depth,其越大越容易过拟合,和最小叶子节点权重min_child_weight,如果树分区中的实例权重小于定义的总和,则停止树构建过程;调节惩罚系数gamma降低模型过拟合风险;调节学习率eta,即降低学习速度,同时增加更多的估计量。
7.根据权利要求1所述基于XGBoost算法的区块链产品检测方法,其特征在于,所述利用所述区块链产品检测的XGBoost模型树对区块链产品进行检测,具体包括:在互联网上爬取区块链产品测试集,对测试集中样本进行贴标签,根据训练得到的树模型,将进行判别检测的区块链产品特征信息输入决策树,即从决策树上到下遍历得到此决策树判别结果,根据测试结果与标签进行比对判别模型的正确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云象网络技术有限公司,未经杭州云象网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010339755.X/1.html,转载请声明来源钻瓜专利网。