[发明专利]基于异质网络表征学习的线上交易多主体行为建模方法有效
申请号: | 201910112493.0 | 申请日: | 2019-02-13 |
公开(公告)号: | CN109829721B | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 王成;朱航宇 | 申请(专利权)人: | 同济大学 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 200000 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 表征 学习 线上 交易 主体 行为 建模 方法 | ||
1.一种基于异质网络表征学习的线上交易多主体行为建模方法,其特征在于,所述建模方法包括步骤:
步骤1,利用关联图谱将原始线上交易数据表示为异质网络,并利用异质网络表征学习对异质网络化的交易数据中缺失的信息进行数据补充,用于建立个体行为模型,该步骤1具体包括:
步骤1.1,根据用户当笔交易数据的原始字段筛选出有用字段,其中原始字段如表1所示,
表1:原始字段
对有用字段进行数据预处理,包括:
将有用字段的数值进行离散化表示,
利用关联图谱描述数据中的关联信息,
将离散化后的字段中任意一个取值视做网络中的节点,
将相互关联的字段对视为网络中一条边,形成一个交易记录构成的关联图谱;步骤1.2,在所构建的关联图谱中,设定正常交易数据产生的边带有正值权重,异常交易数据产生的边带有负值权重;
一条多次出现的边的权重是其每次出现的权重之和,当权重之和小于或等于零时,在网络中删除这条边;
根据公式(1)对权重之和进行变换,缩小权重之间的巨大差异,
通过上述步骤,得到一个带有权重的异质信息网络,执行步骤1.4,
x表示一条边所对应的权重值,S(x)表示经变换后的权重值,调节权重的超参数α、β的根据需调节的权重比值设定,α影响权重的缩放程度,β影响权重值小时的权重的缩放程度,公式(1)为
步骤1.3,基于步骤1.2中所构建的带权重的异质信息网络,利用异质网络表征学习方法HIN2Vec来得到网络中节点的向量表示,方法HIN2Vec学习向量表示的主要参数如表2所示,
表2:HIN2Vec主要参数
;
步骤1.4,基于步骤1.3中的节点向量表示,每一笔交易数据转化为向量空间中对应的若干节点,即向量空间中节点的组合可表示一笔交易数据,针对向量空间中所有节点重新组合,得到所有可能发生的交易数据;
步骤2,利用多主体行为建模,建立多个不同维度主体的行为模型,综合多个主体行为模型获得判别结果,预测交易异常的可能性,该步骤2具体包括:
步骤2.1,一条含有N个字段的交易数据可以对应向量空间中N个向量,计算任意两个向量之间的欧式距离集合{d1,···,dK},其中集合的大小,面对向量V1=(v1,1,····,v1,dim)、向量V2=(v2,1,····,v2,dim),其欧式距离的计算如公式(2)所示,
即一条交易记录可用欧氏距离集合{d1,···,dK}表示,定义一条交易记录的凝聚度c为公式(3),超参数W={w0,···,wK}通过对训练数据进行回归分析得到,
步骤2.2,选择交易卡号字段为主体,针对所有交易卡号建立个体行为模型,
设定其个体行为模型是一个能够描述该交易卡号所有可能出现的交易记录及其对应概率的离散分布,该分布的大小为除交易卡号外所有其他交易字段可取值数目的积,
针对选定的主体g,其所有可能出现的交易记录集合为Tg,t为Tg中的一种情况,ct是t所对应的凝聚度,可以得到情况t在分布中对应的概率pt,如公式(4),是归一化函数,
对Tg中每一种情况计算其概率,得到以g为主体的个体行为模型Pg,
步骤2.3,针对以g为主体的个体行为模型Pg,计算其对应的信息熵Hg,信息熵Hg的计算如公式(5)所示,Hg表示模型Pg的可信程度,Hg值越大,主体g对应的个体模型行为越不稳定,Pg越不准确,
步骤2.4,对待检测的交易数据集T中的每一条t,计算其异常值得分scoret,g,如公式(6),其中,
异常值得分scoret,g表示主体g对应的交易记录t的异常得分,
超参数N0为偏置项,负责调整个体行为模型中当前交易记录t之外的其他记录对得分的影响程度,N0越大,其他记录对得分的影响程度越低,
步骤2.5,依次选取输入的待建模主体对应字段,用其代替步骤2.2中的交易卡号字段,循环执行步骤2.2至步骤2.4,返回不同主体对交易的判断结果集合gi表示不同的主体,
步骤2.6,针对不同的主体分别设定阈值区间thresholdg,将得分scoret,g属于阈值期间的交易标签设置labelt,g=1,否则设置labelt,g=0,
根据公式(7)所示,labelt,g=1表示主体g判断交易t为异常交易,综合考虑多个主体判断结果对应的labelt,g,判断交易的异常与否,
综合考虑多个主体判断结果的方案,包括加权制、投票制、一票否决制,加权制是将每个结果占一定比例,所有结果加权后的总分作为最终结果;投票制是规定判断为异常的主体达到一定数量方才视交易记录为异常交易;一票否决制是只要某一主体判断结果为异常,即视该笔交易为异常交易。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910112493.0/1.html,转载请声明来源钻瓜专利网。