[发明专利]检测黑盒模型中变量重要性的方法和装置在审
申请号: | 201410302773.5 | 申请日: | 2014-06-27 |
公开(公告)号: | CN105335593A | 公开(公告)日: | 2016-02-17 |
发明(设计)人: | 崔阳 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张大威 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 黑盒 模型 变量 重要性 方法 装置 | ||
技术领域
本申请涉及数据处理技术领域,尤其涉及一种检测黑盒模型中变量重要性的方法和装置。
背景技术
随着互联网技术的发展,经常需要系统性的预测方案,例如数据挖掘模型。非线性模型因其优于传统线性模型的预测性能而在计算机安全领域广为应用。
但是,非线性模型会面临模型黑盒问题,即知道模型输出分数却无法理解真正起作用的变量,无法解析模型的打分行为,也无法从变量角度进行人为的模型优化。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的一个目的在于提出一种检测黑盒模型中变量重要性的方法,该方法可以获知黑盒模型中各变量的重要性,从而理解模型的打分思维,优化模型结构,进而提升系统对外部攻击的预测能力和防御能力。
本申请的另一个目的在于提出一种检测黑盒模型中变量重要性的装置。
为达到上述目的,本申请第一方面实施例提出的检测黑盒模型中变量重要性的方法,包括:获取黑盒模型的原始分数;选取所述黑盒模型中当前处理的变量,并获取所述当前处理的变量的替换值;将所述替换值作为所述黑盒模型的输入重新计算所述黑盒模型的分数,得到重新计算后的分数;获取所述重新计算后的分数与所述原始分数的差值;根据所述差值确定所述当前处理的变量的重要性。
本申请第一方面实施例提出的检测黑盒模型中变量重要性的方法,通过将当前处理的变量的替换值作为输入重新计算分数,根据重新计算后的分数与原始分数的差值确定当前处理的变量的重要性,可以获知黑盒模型中各变量的重要性,从而理解模型的打分思维,优化模型结构,进而提升系统对外部攻击的预测能力和防御能力。
为达到上述目的,本申请第二方面实施例提出的检测黑盒模型中变量重要性的装置,包括:获取模块,用于获取黑盒模型的原始分数;选取模块,用于选取所述黑盒模型中当前处理的变量,并获取所述当前处理的变量的替换值;计算模块,用于将所述替换值作为所述黑盒模型的输入重新计算所述黑盒模型的分数,得到重新计算后的分数;处理模块,用于获取所述重新计算后的分数与所述原始分数的差值;确定模块,用于根据所述差值确定所述当前处理的变量的重要性。
本申请第二方面实施例提出的检测黑盒模型中变量重要性的装置,通过将当前处理的变量的替换值作为输入重新计算分数,根据重新计算后的分数与原始分数的差值确定当前处理的变量的重要性,可以获知黑盒模型中各变量的重要性,从而理解模型的打分思维,优化模型结构,进而提升系统对外部攻击的预测能力和防御能力。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一实施例提出的检测黑盒模型中变量重要性的方法的流程示意图;
图2是本申请另一实施例提出的检测黑盒模型中变量重要性的方法的流程示意图;
图3是本申请另一实施例提出的检测黑盒模型中变量重要性的方法的流程示意图;
图4是本申请另一实施例提出的检测黑盒模型中变量重要性的装置的结构示意图;
图5是本申请另一实施例提出的检测黑盒模型中变量重要性的装置的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1是本申请一实施例提出的检测黑盒模型中变量重要性的方法的流程示意图,该方法包括:
S11:获取黑盒模型的原始分数。
本实施例的执行主体可以是风险模型平台的模型解释模块。
其中,黑盒模型指一些其内部规律还很少为人们所知的模型。例如,黑盒模型可以是非线性风险预估模型。
原始分数是指根据黑盒模型的变量的初始值计算出的分数。
S12:选取所述黑盒模型中当前处理的变量,并获取所述当前处理的变量的替换值。
其中,在处理时可以依次选择一个黑盒模型的一个变量进行处理,当前处理的变量是指当前在多个变量中选择的一个变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410302773.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用