[发明专利]一种基于异构图嵌入的移动广告欺诈检测方法有效
申请号: | 201910417284.7 | 申请日: | 2019-05-20 |
公开(公告)号: | CN110189167B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 胡金龙;庄懿;陈浪;黄旸珉;黄松;董守斌 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 构图 嵌入 移动 广告 欺诈 检测 方法 | ||
本发明公开了一种基于异构图嵌入的移动广告欺诈检测方法,包括步骤:1)获取移动广告日志数据并对数据进行预处理;2)提取用户、应用和广告三者关联关系数据,构建有权异构图;3)定义元路径,设定每个节点的游走次数和最长步长,遍历有权异构图节点,构建节点元路径随机游走序列;4)使用语言模型,构建有权异构图中节点的低维空间稠密向量表示;5)定义标签,构成被试数据;6)构建移动广告欺诈检测模型;7)将训练部分的移动应用被试数据输入至移动广告欺诈检测模型训练,得到移动广告欺诈检测模型;8)采用移动广告欺诈检测模型对移动应用进行欺诈检测。本发明利用移动广告系统中的实体关联关系,有效的检测出欺诈的移动应用。
技术领域
本发明涉及移动应用广告欺诈的技术领域,尤其是指一种基于异构图嵌入的移动广告欺诈检测方法。
背景技术
移动广告作为一种依托于智能终端的新型营销方式,与传统媒体相比具有精确性、互动性、灵活性以及个性化等特点。然而不断增长的广告欺诈行为给移动广告市场带来严重的威胁,识别出移动应用的欺诈行为非常困难,广告欺诈检测已成为移动互联网广告生态系统中亟待解决的热点问题。由于对结构化数据有良好的表示能力且具有鲁棒性,基于图结构数据的图分析方法被应用于异常和欺诈检测。
传统基于图结构的分析方法在大规模图中效率较低,且现有的深度学习等有效方案难以直接应用于图结构数据的分析,图嵌入方法为图中的节点学习一个低维空间中的有效向量表示,从而更好地支持后续图数据分析。针对复杂多变的移动广告欺诈手段,如何利用基于图嵌入的方法对欺诈移动应用做出高效的检测,是亟待解决的问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出了一种基于异构图嵌入的移动广告欺诈检测方法,能够提高移动应用广告欺诈检测的准确性。
为实现上述目的,本发明所提供的技术方案为:一种基于异构图嵌入的移动广告欺诈检测方法,包括以下步骤:
1)获取移动广告日志数据,对数据进行预处理;
2)提取移动广告生态系统中用户、应用和广告的关联关系数据,构建有权异构图,其对应的meta模板和分别代表类别集和边的关系类别集,且满足
3)定义元路径设定每个节点的游走次数n和最长步长l,遍历有权异构图G中的节点,构建节点v的n条有权随机游走路径Sv={Sv1,Sv2,...,Svn},最终得到有权异构图G的元路径随机游走序列S;
4)构建语言模型,学习有权异构图G中P个移动应用节点的d维空间稠密向量表示X∈RP×d,构成输入特征向量;
5)对训练部分的移动应用进行人工标注,按照是否为欺诈应用的信息设置每个移动应用的标签取值;欺诈应用的标签设置为1,非欺诈应用的标签设置为0,得到Ptrain个标签数据Ptrain<P,Ptrain为训练部分应用总数P*η,η为小于1但大于0的浮点数,而后与步骤4)中的对应输入特征向量结合构成被试数据;
6)构建欺诈检测模型,用于检测欺诈的移动应用;
7)将被试数据输入到欺诈检测模型当中,获取欺诈检测模型参数,得到移动广告欺诈检测模型;
8)将未标注的移动应用输入特征输入到移动广告欺诈检测模型当中,进行欺诈应用的检测。
在步骤1)中,数据预处理包括数据清洗和缺失值填充;移动广告日志数据包含四个属性:a、唯一标识属性:用户、应用、广告的唯一标识符;b、时间属性:用户使用应用操作广告发生的具体时间,精确到秒;c、位置属性:标识用户所处的地理位置;d、设备属性:用户所用的设备的型号、显示屏大小、操作系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910417284.7/2.html,转载请声明来源钻瓜专利网。