[发明专利]基于主成分分析算法的渠道反作弊方法、装置和电子设备在审
申请号: | 202011191054.2 | 申请日: | 2020-10-30 |
公开(公告)号: | CN112288016A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 于洋 | 申请(专利权)人: | 上海淇玥信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/18 |
代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 杜焱 |
地址: | 200333 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成分 分析 算法 渠道 作弊 方法 装置 电子设备 | ||
本发明涉及计算机技术领域,具体涉及基于主成分分析算法的渠道反作弊方法、装置和电子设备,对渠道数据特征进行数据降维,将多维数据特征映射到二维平面上的点;对所述二维平面上的点进行转化,计算映射点和转化后的二维平面上的点之间的欧氏距离;对所述欧氏距离进行分区段频数统计,获取异常渠道扣掉的数量。本发明将复杂的数据进行中心化处理,完成高维数据到低维数据的转化,减小数据的复杂程度;通过得到数据的主要成分,舍弃次要成分,降低数据计算的难度;简化了各渠道和标准参考渠道差异化的计算过程,让结果更加显而易见,提升作弊渠道判断的准确性。
技术领域
本发明涉及计算机技术领域,尤其涉及基于主成分分析算法的渠道反作弊方法、装置和电子设备。
背景技术
现在做的渠道反作弊方法基于投资回报率(return on investment)来判断渠道的欺诈行为,此方法的缺点在于ROI的计算方式需要对每一个特征进行计算,并且没有进行主要成分的提取与分析,使得计算量大,过程繁琐,不能迅速分离主要特征对结果的影响,并且对于渠道作弊数据的敏感性较小,导致不能准确地判断出渠道的作弊行为。
发明内容
本发明提供了基于主成分分析算法的渠道反作弊方法、装置和电子设备,用以降低数据计算的难度,简化了各渠道和标准参考渠道差异化的计算过程,提升作弊渠道判断的准确性。
本说明书实施例提供基于主成分分析算法的渠道反作弊方法,包括:
对渠道数据特征进行数据降维,将多维数据特征映射到二维平面上的点;
对所述二维平面上的点进行转化,计算映射点和转化后的二维平面上的点之间的欧氏距离;
对所述欧氏距离进行分区段频数统计,获取异常渠道扣掉的数量。
优选的,所述对所述二维平面上的点进行转化,包括:
保持原点不动,旋转坐标轴;
将所述二维平面上的点向所述坐标轴做正交分解,当所述二维平面上的点落到Y轴上坐标值之和最小时,停止旋转所述坐标轴;
获取所述二维平面上的点于当前坐标轴位置下X轴上的坐标值。
优选的,所述对所述欧氏距离进行分区段频数统计,包括:
对所述欧氏距离进行区段分割;
对不同区段的数值进行频数统计。
优选的,所述获取异常渠道扣掉的数量,包括:
通过正态分布确定3σ的距离值;
通过所述3σ的距离值判定所述异常渠道;
根据所述异常渠道的坐标点到所述转化后的二维平面上的点的距离,计算所述异常渠道的扣量比例;
根据所述扣量比例计算所述异常渠道扣掉的数量。
优选的,所述对渠道数据特征进行数据降维,包括:
通过主成分分析算法对渠道数据特征进行数据降维。
优选的,所述数据降维为对所述渠道数据特征进行中心化处理,去除冗余信息。
优选的,当所述数据为一维数据时,通过计算一维数据的平均值对所述一维数据进行中心化处理。
本说明书实施例还提供基于主成分分析算法的渠道反作弊装置,其特征在于,包括:
映射模块,对渠道数据特征进行数据降维,将多维数据特征映射到二维平面上的点;
转化模块,对所述二维平面上的点进行转化,计算映射点和转化后的二维平面上的点之间的欧氏距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011191054.2/2.html,转载请声明来源钻瓜专利网。