[发明专利]基于XGBoost回归与卷积网络的数据资产分析方法、系统及介质在审
申请号: | 202110767832.6 | 申请日: | 2021-07-07 |
公开(公告)号: | CN113205093A | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 李志杰 | 申请(专利权)人: | 浙江中科华知科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04;G06N3/08;G06N20/20;G06Q30/06 |
代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 张德宝 |
地址: | 311121 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 xgboost 回归 卷积 网络 数据 资产 分析 方法 系统 介质 | ||
1.一种基于XGBoost回归与卷积网络的数据资产分析方法,其特征在于,包括以下步骤:
采集数据资产信息形成数据链,以获取图像类数据资产像素集;
通过训练好的卷积神经网络模型提取所述图像类数据资产像素集的特征值得到图像类数据资产特征集;
利用预设的特征提取算法提取所述数据链中的非图像类文件得到非图像类数据资产特征集;
将所述非图像类数据资产特征集作为XGBoost算法的输入进行回归分析得到第一结果;
将所述图像类数据资产特征集与所述非图像类数据资产特征集共同作为所述XGBoost算法的输入进行回归分析得到第二结果;
计算目标偏差率,与预设的比率阈值进行比较,其中,
若所述目标偏差率小于所述比率阈值,则将所述第二结果作为最终结果输出;
若所述目标偏差率大于或等于所述比率阈值,则将所述第一结果作为最终结果输出。
2.根据权利要求1所述的一种基于XGBoost回归与卷积网络的数据资产分析方法,其特征在于,还包括识别所述数据链信息的真实性,具体为:
获取所述数据链上信息欺诈因子;
通过识别所述欺诈因子得到信息真实性评估分值,与预设的分数阈值进行比较,其中,
若所述评估分值大于所述分数阈值则继续获取所述图像类数据资产像素集;
若所述评估分值小于或等于所述分数阈值,则进行人工介入核实,其中,
若人工介入结果显示为非欺诈信息,则继续获取所述图像类数据资产像素集;
若人工介入结果显示为有欺诈信息,则输出“包含欺诈信息”的文本信息作为所述最终结果。
3.根据权利要求1所述的一种基于XGBoost回归与卷积网络的数据资产分析方法,其特征在于,所述卷积神经网络模型的训练方法为:
采用多卷积核对输入的图像类数据资产像素集进行卷积操作得到不同像素点之间的关联信息;
采用预设的池化方法降低卷积层的维度,使用反向传播算法训练模型;
采用交叉熵作为损失函数来评估所述训练模型,直至损失不再下降以得到所述训练好的所述卷积神经网络模型。
4.根据权利要求3所述的一种基于XGBoost回归与卷积网络的数据资产分析方法,其特征在于,所述卷积神经网络模型训练方法还包括在训练过程中,使用预设的dropout机制丢弃神经元,并且在权重更新时加入L2正则化算法以减小模型复杂度。
5.根据权利要求1所述的一种基于XGBoost回归与卷积网络的数据资产分析方法,其特征在于,所述利用预设的特征提取算法提取所述数据链中的非图像类文件得到非图像类数据资产特征集;具体为:
选取OCR算法作为所述预设的特征提取算法;
基于所述OCR算法识别所述数据链上的非图像类文件;
将所述非图像类文件经过所述OCR算法进行特征提取得到所述非图像类数据资产特征集。
6.根据权利要求5所述的一种基于XGBoost回归与卷积网络的数据资产分析方法,其特征在于,获取所述图像类数据资产像素集,具体为:
通过所述OCR算法提取所述数据链中的图像类文件及其像素信息;
提炼所述图像类文件不同位置的颜色码,转换成像素矩阵以构成所述图像类数据资产像素集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江中科华知科技股份有限公司,未经浙江中科华知科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110767832.6/1.html,转载请声明来源钻瓜专利网。