[发明专利]解释业务处理模型的业务处理结果的方法和装置有效
申请号: | 201911326360.X | 申请日: | 2019-12-20 |
公开(公告)号: | CN111062442B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 唐才智 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N20/00;G06Q20/40;G06Q40/02 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解释 业务 处理 模型 结果 方法 装置 | ||
1.一种解释业务处理模型的业务处理结果的方法,所述方法包括:
将待解释样本输入预先训练的基于变分自动编码器VAE的生成模型,得到第一数目个扰动样本,所述待解释样本和所述扰动样本均包含多个特征维度;
将所述待解释样本和所述第一数目个扰动样本分别输入通过神经网络实现的业务处理模型,通过所述业务处理模型输出所述待解释样本对应的第一业务处理结果,以及各扰动样本分别对应的第二业务处理结果;
以所述第二业务处理结果与所述第一业务处理结果一致作为筛选条件,从所述第一数目个扰动样本中筛选出第二数目个扰动样本;
统计所述第二数目个扰动样本与所述待解释样本在各特征维度上的差异,根据所述各特征维度上的差异对所述第一业务处理结果作出解释。
2.如权利要求1所述的方法,其中,所述待解释样本对应于目标用户;
所述业务处理模型输出的业务处理结果用于指示是否拦截所述目标用户的预设行为。
3.如权利要求1所述的方法,其中,所述业务处理模型包括深度神经网络DNN。
4.如权利要求1所述的方法,其中,所述生成模型通过如下方式训练:
将训练样本输入所述生成模型,通过所述生成模型输出训练扰动样本;
把所述训练样本和所述训练扰动样本输入所述业务处理模型,所述业务处理模型包括若干隐层;
针对所述若干隐层中的目标隐层,获取所述训练样本和所述训练扰动样本分别在所述目标隐层的目标隐向量和扰动隐向量;确定所述目标隐向量和所述扰动隐向量之间的交叉熵;
根据所述交叉熵确定重构误差;
以最小化所述重构误差为目标,对所述生成模型进行训练。
5.如权利要求4所述的方法,其中,所述目标隐层为所述若干隐层中的任一隐层;
所述根据所述交叉熵确定重构误差,包括:
将所述若干隐层中各隐层分别对应的交叉熵进行求和,从而确定重构误差。
6.如权利要求1所述的方法,其中,所述生成模型包括编码器、解码器和采样单元;
所述编码器,用于接收输入样本,通过所述编码器输出所述输入样本对应的隐向量所服从的高斯分布的均值和方差;
所述采样单元,用于从所述编码器输出的均值和方差对应的高斯分布的各隐向量中采样得到第一隐向量;
所述解码器,用于对所述第一隐向量解码得到第一扰动样本。
7.如权利要求6所述的方法,其中,所述编码器包括:深度神经网络DNN、多层感知器MLP或卷积神经网络CNN。
8.如权利要求6所述的方法,其中,所述将待解释样本输入预先训练的基于变分自动编码器VAE的生成模型,得到第一数目个扰动样本,包括:
将待解释样本作为输入样本输入预先训练的所述编码器,通过所述编码器输出所述输入样本对应的隐向量所服从的高斯分布的均值和方差;
所述采样单元从所述编码器输出的均值和方差对应的高斯分布的各隐向量中采样得到第一数目个第一隐向量;
所述解码器对所述第一数目个第一隐向量解码得到第一数目个第一扰动样本。
9.如权利要求1所述的方法,其中,所述统计所述第二数目个扰动样本与所述待解释样本在各特征维度上的差异,根据所述各特征维度上的差异对所述第一业务处理结果作出解释,包括:
统计所述第二数目个扰动样本与所述待解释样本在各特征维度上的方差,根据所述各特征维度上的方差,确定对得到所述第一业务处理结果的依据中所述各特征维度的重要度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911326360.X/1.html,转载请声明来源钻瓜专利网。