[发明专利]一种数据的识别处理方法有效
申请号: | 201210077032.2 | 申请日: | 2012-03-21 |
公开(公告)号: | CN102663021A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 戴霖;田宁;刘崟;谭磊 | 申请(专利权)人: | 浙江盘石信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
代理公司: | 杭州宇信知识产权代理事务所(普通合伙) 33231 | 代理人: | 张宇娟 |
地址: | 310011 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 识别 处理 方法 | ||
技术领域
本发明属于互联网信息处理技术领域,尤其是互联网联盟广告技术领域,涉及一种数据的识别处理方法。
背景技术
随着互联网技术的不断发展,互联网广告市场规模发展迅猛,在广告业中占据着越加重要的位置。网站联盟作为互联网广告中最为重要的形式之一,因为其覆盖面广、精准度高和实时灵活性而倍受关注。同时,该广告形式也面临着广告欺诈的困扰。
广告欺诈是指网民受金钱、利益等吸引对网络广告进行恶意反复点击或显示的行为,以达到收获金钱或打压竞争对手等目的。广告欺诈在消耗广告主费用的同时,也严重影响了广告客户对这一新兴的网络市场销售工具的信心,对整个互联网广告行业产生着非常消极的影响,甚至可能影响到这一模式的生存发展。因此,如何实时、准确的识别广告欺诈,这对网站联盟的健康快速发展有着非常重要的影响。
目前技术解决该问题的方法主要有两种:一是从流量监控角度,对重复流量进行阻止或不予计费。该方法对于一些通过软件或雇佣人力不断重复刷新的欺诈行为有领好效果,但对于如今更为智能的欺诈行为,如点击联盟等,则收效甚微;另一种解决方式是采用对获取的用户访问数据依一定算法进行分析,对欺诈行为进行实时反馈和组织。然而,由于该类算法主要进行实时分析与反馈,数据和识别力度的有限,导致其识别准确率也同样有限。并且,对于联盟中不可小觑的作弊群体和站点,其也无法进行有效识别。
故,实有必要进行研究,提供一种解决方案,解决目前的互联网广告欺诈的识别方法响应速度和识别准确性有限的问题。
发明内容
为解决上述问题,本发明的目的在于提供一种数据的识别处理方法,以准确识别互联网广告欺诈,且快速响应互联网广告欺诈的识别。
为实现上述目的,本发明的技术方案为:
一种数据的识别处理方法,包括如下步骤:
S10:对数据进行实时识别,并将识别出的欺诈数据和非欺诈数据以及数据对应信任值分别存入数据库;
S11:对数据进行定时识别,并将识别出的欺诈站点存入欺诈站点数据库,同时将得到的站点信任值分配给站点下的数据;
S12:对数据进行综合识别,结合定时识别阶段获取的信任值,将实时识别中存入非欺诈数据库中的数据进行再一次的识别判断。
进一步地,所述步骤S10具体包括有步骤:
S101:建立模块划分库,并对每个模块依已有经验进行质量值分配;
S102:对每条用户访问数据进行基于模块的统计分析与质量值获取;
S103:对各模块进行数据融合,通过公式将各模块的质量值融合,得到该条数据对于欺诈属性的信任值;其中,r_belj是指第j条用户访问数据对欺诈属性的信任值,n为模块个数,αi代表第i个模块中的数据对欺诈属性的质量值;
S104:将该信任值与预先设定的实时欺诈识别信任值阈值比较,做出数据是否为欺诈数据的实时判断。
进一步地,所述步骤S11具体包括有步骤:
S111:建立维度库,对数据依据其分布属性进行维度选择,并依照已有经验建立维度标准分布库;
S112:数据聚合与统计,对用户访问数据进行基于站点的聚合,并对聚合后数据进行基于维度的分布统计;
S113:各维度相似度计算,根据公式进行各维度与标准维度的相似度计算;其中,simi是指站点实际的i维度分布与标准i维度分布的相似值,是指标准i维度分布向量,是指站点实际的i维度分布向量;
S114:根据公式对各维度进行数据融合,得到该站点数据对于欺诈属性的信任值;其中,f_elj是指站点j中各维度分布对欺诈属性的信任值,m表示维度个数;
S115:将所获得的欺诈信任值f_belj与定时欺诈识别信任值阈值比较,若大于预设阈值,则判断该站点为欺诈站点;否则,判断为非欺诈站点。
进一步地,所述步骤S12具体包括有步骤:
S121:分配定时欺诈识别信任值,将定时欺诈识别中得到的站点信任值分配到其对应的各用户访问数据上;
S122:两模块数据融合,采用公式对两模块数据融合进行计算;其中,w_belj是指第j条用户访问数据对欺诈属性的信任值;
S123:将所获得的欺诈信任值与综合欺诈识别信任值阈值比较,若大于预设阈值,则判断该条用户访问数据为欺诈数据;否则,判断为非欺诈数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江盘石信息技术有限公司,未经浙江盘石信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210077032.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电池升温电路和电池升温装置
- 下一篇:初始pH复原测定油品酸值的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置