[发明专利]检测变量重要性的方法和装置在审
申请号: | 201410759499.4 | 申请日: | 2014-12-10 |
公开(公告)号: | CN105740280A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 崔阳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q10/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 变量 重要性 方法 装置 | ||
技术领域
本申请涉及数据处理技术领域,尤其涉及一种检测变量重要性的方法和装置。
背景技术
随着互联网技术的发展,在线系统面临的安全攻击也越来越多,为了提高安全性,需要采用预测模型进行预测,预测模型例如为:数据挖掘模型。
为了更好的理解预测模型,需要解析预测模型的变量及其重要性。信息码(InfoCode)旨在完成“黑盒白盒化”的使命,解析对预测模型的分值影响最显著的若干变量以及其业务意义,理解模型的打分思维,优化模型结构,进而提升系统对外部攻击的预测能力和防御能力。现有技术中,为了普适性,确定变量重要性的方法需要较大的运算量。
但是,当预测模型是线性模型时,需要考虑更为合适的确定方式。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种检测变量重要性的方法,该方法可以降低计算量,更适用于线性模型。
本申请的另一个目的在于提出一种检测变量重要性的装置。
为达到上述目的,本申请第一方面实施例提出的检测变量重要性的方法,包括:获取预测模型,所述预测模型是线性模型;获取对所述线性模型的触发事件;在获取到所述触发事件后,获取所述线性模型中变量的替换值以及所述线性模型的系数值,并根据所述系数值和所述替换值,确定所述变量的贡献值,将所述贡献值确定为所述变量的重要性数值,其中,具有所述替换值的变量变换为单调变量,以及根据所述系数和所述替换值确定的不同变量的贡献值之间的相关性数值小于预设值,且所述系数的符号一致;根据所述变量的重要性数值对所述触发事件进行预测。
本申请第一方面实施例提出的检测变量重要性的方法,通过在确定系数时,使得根据所述系数和所述替换值确定的不同变量的贡献值之间的相关性数值小于预设值,且所述系数的符号一致,并将根据系数和替换值得到的贡献值确定为变量的重要度数值,因此,可以直接根据线性模型的训练结果确定变量的重要度数值,不需要普适方法中专门的计算,从而可以降低计算量,更适用于线性模型。
为达到上述目的,本申请第二方面实施例提出的检测变量重要性的装置,包括:第一获取模块,用于获取预测模型,所述预测模型是线性模型;第二获取模块,用于获取对所述线性模型的触发事件;处理模块,用于在获取到所述触发事件后,获取所述线性模型中变量的替换值以及所述线性模型的系数值,并根据所述系数值和所述替换值,确定所述变量的贡献值,将所述贡献值确定为所述变量的重要性数值,其中,具有所述替换值的变量变换为单调变量,以及根据所述系数和所述替换值确定的不同变量的贡献值之间的相关性数值小于预设值,且所述系数的符号一致;预测模块,用于根据所述变量的重要性数值对所述触发事件进行预测。
本申请第二方面实施例提出的检测变量重要性的装置,通过在确定系数时,使得根据所述系数和所述替换值确定的不同变量的贡献值之间的相关性数值小于预设值,且所述系数的符号一致,并将根据系数和替换值得到的贡献值确定为变量的重要度数值,因此,可以直接根据线性模型的训练结果确定变量的重要度数值,不需要普适方法中专门的计算,从而可以降低计算量,更适用于线性模型。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一实施例提出的检测变量重要性的方法的流程示意图;
图2是本申请另一实施例提出的检测变量重要性的方法的流程示意图;
图3是本申请另一实施例提出的检测变量重要性的方法的流程示意图;
图4是本申请另一实施例提出的检测变量重要性的方法的流程示意图;
图5是本申请另一实施例提出的检测变量重要性的装置的结构示意图;
图6是本申请另一实施例提出的检测变量重要性的装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一实施例提出的检测变量重要性的方法的流程示意图,该方法包括:
S11:获取预测模型,所述预测模型是线性模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410759499.4/2.html,转载请声明来源钻瓜专利网。