[发明专利]数据处理方法及装置在审
申请号: | 201610055212.9 | 申请日: | 2016-01-27 |
公开(公告)号: | CN107016398A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 冯银付;黄刚;胡熠 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙)11412 | 代理人: | 孟繁琦 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
【技术领域】
本申请涉及互联网技术领域,尤其涉及一种数据处理方法及装置。
【背景技术】
随着互联网技术的发展,网络平台上提供的网络资源越来越多。对于网络平台来说,一般会设置一些规则用于对网络资源及其使用进行限制和规范。但是,有些网络资源提供者可能会刻意规避网站设置的规则,使网络资源的排序靠前或吸引用户点击,从而达到引流的目的。例如,在电商领域,卖家通过设置该商品的价格为超低价或超高价,或者将不同商品违规放在一起或多个商品捆绑销售等,使得所卖商品的价格与平台其他商品的价格差异拉大,进而在商品价格相关的排序中非法获利。
异常检测是目前数据挖掘领域里的一个热门课题。通过异常检测技术可以发现潜在的违规行为。一种现有的异常检测技术是基于模型训练的异常检测方法,该方法的原理是:
在有标注训练数据的情况下,利用有监督学习算法或半监督学习算法,如支持向量机(Support Vector Machine,SVM)、线性回归(Linear Regression,LR)和神经网络(Neural Network,NN)等,训练得到分类器,对商品价格是否异常进行判断。在没有标注数据的情况下,数据聚类分析是最常用的方式,K-Means和混合高斯聚类等模型常被用来对数据进行聚类。基于模型训练的方法由于是学习得到一个可重用的算法模型或者数据聚类结果,因此可以对新加入的数据进行快速判断,具有较强的泛化能力。
但是,基于模型训练的方法通常需要有标注数据,然而对数据进行标注成本昂贵,人工工作量也较大,并不适合数据量较大的场景。
【发明内容】
本申请的多个方面提供一种数据处理方法及装置,无需对数据进行标注,即可实现对异常数据的检测。
本申请的一方面,提供一种数据处理方法,包括:
获取目标类目下至少一个数据对象分别作为待处理数据对象;
对每个待处理数据对象,根据所述待处理数据对象的指定业务参数在所述待处理数据对象具有的各检测属性取不同属性值时的取值,获取所述待处理数据对象的异常度;
根据各待处理数据对象的异常度,确定所述各待处理数据对象中的异常数据对象。
本申请的另一方面,提供一种数据处理装置,包括:
第一获取模块,用于获取目标类目下至少一个数据对象分别作为待处理数据对象;
第二获取模块,用于对每个待处理数据对象,根据所述待处理数据对象的指定业务参数在所述待处理数据对象具有的各检测属性取不同属性值时的取值,获取所述待处理数据对象的异常度;
第一确定模块,用于根据各待处理数据对象的异常度,确定所述各待处理数据对象中的异常数据对象。
在本申请中,获取目标类目下各数据对象分别作为待处理数据对象,对每个待处理数据对象,根据该待处理数据对象的指定业务参数在该待处理数据对象具有的各检测属性取不同属性值时的取值,获取该待处理数据对象的异常度,进而根据各待处理数据对象的异常度,确定各待处理数据对象中的异常数据对象,实现了异常检测,同时无需标注数据,具有实现方便且成本较低等优势。
【附图说明】
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的数据处理方法的流程示意图;
图2为本申请另一实施例提供的数据处理装置的结构示意图;
图3为本申请又一实施例提供的数据处理装置的结构示意图。
【具体实施方式】
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一实施例提供的数据处理方法的流程示意图。如图1所示,该方法包括:
101、获取目标类目下至少一个数据对象分别作为待处理数据对象。
102、对每个待处理数据对象,根据该待处理数据对象的指定业务参数在该待处理数据对象具有的各检测属性取不同属性值时的取值,获取该待处理数据对象的异常度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610055212.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中置式开关柜绝缘触头盒
- 下一篇:一种主变低构架横穿的配电装置