[发明专利]数据处理方法及装置在审

专利信息
申请号: 201610055212.9 申请日: 2016-01-27
公开(公告)号: CN107016398A 公开(公告)日: 2017-08-04
发明(设计)人: 冯银付;黄刚;胡熠 申请(专利权)人: 阿里巴巴集团控股有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 北京鸿德海业知识产权代理事务所(普通合伙)11412 代理人: 孟繁琦
地址: 英属开曼群岛大开*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据处理 方法 装置
【说明书】:

【技术领域】

本申请涉及互联网技术领域,尤其涉及一种数据处理方法及装置。

【背景技术】

随着互联网技术的发展,网络平台上提供的网络资源越来越多。对于网络平台来说,一般会设置一些规则用于对网络资源及其使用进行限制和规范。但是,有些网络资源提供者可能会刻意规避网站设置的规则,使网络资源的排序靠前或吸引用户点击,从而达到引流的目的。例如,在电商领域,卖家通过设置该商品的价格为超低价或超高价,或者将不同商品违规放在一起或多个商品捆绑销售等,使得所卖商品的价格与平台其他商品的价格差异拉大,进而在商品价格相关的排序中非法获利。

异常检测是目前数据挖掘领域里的一个热门课题。通过异常检测技术可以发现潜在的违规行为。一种现有的异常检测技术是基于模型训练的异常检测方法,该方法的原理是:

在有标注训练数据的情况下,利用有监督学习算法或半监督学习算法,如支持向量机(Support Vector Machine,SVM)、线性回归(Linear Regression,LR)和神经网络(Neural Network,NN)等,训练得到分类器,对商品价格是否异常进行判断。在没有标注数据的情况下,数据聚类分析是最常用的方式,K-Means和混合高斯聚类等模型常被用来对数据进行聚类。基于模型训练的方法由于是学习得到一个可重用的算法模型或者数据聚类结果,因此可以对新加入的数据进行快速判断,具有较强的泛化能力。

但是,基于模型训练的方法通常需要有标注数据,然而对数据进行标注成本昂贵,人工工作量也较大,并不适合数据量较大的场景。

发明内容】

本申请的多个方面提供一种数据处理方法及装置,无需对数据进行标注,即可实现对异常数据的检测。

本申请的一方面,提供一种数据处理方法,包括:

获取目标类目下至少一个数据对象分别作为待处理数据对象;

对每个待处理数据对象,根据所述待处理数据对象的指定业务参数在所述待处理数据对象具有的各检测属性取不同属性值时的取值,获取所述待处理数据对象的异常度;

根据各待处理数据对象的异常度,确定所述各待处理数据对象中的异常数据对象。

本申请的另一方面,提供一种数据处理装置,包括:

第一获取模块,用于获取目标类目下至少一个数据对象分别作为待处理数据对象;

第二获取模块,用于对每个待处理数据对象,根据所述待处理数据对象的指定业务参数在所述待处理数据对象具有的各检测属性取不同属性值时的取值,获取所述待处理数据对象的异常度;

第一确定模块,用于根据各待处理数据对象的异常度,确定所述各待处理数据对象中的异常数据对象。

在本申请中,获取目标类目下各数据对象分别作为待处理数据对象,对每个待处理数据对象,根据该待处理数据对象的指定业务参数在该待处理数据对象具有的各检测属性取不同属性值时的取值,获取该待处理数据对象的异常度,进而根据各待处理数据对象的异常度,确定各待处理数据对象中的异常数据对象,实现了异常检测,同时无需标注数据,具有实现方便且成本较低等优势。

【附图说明】

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请一实施例提供的数据处理方法的流程示意图;

图2为本申请另一实施例提供的数据处理装置的结构示意图;

图3为本申请又一实施例提供的数据处理装置的结构示意图。

【具体实施方式】

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请一实施例提供的数据处理方法的流程示意图。如图1所示,该方法包括:

101、获取目标类目下至少一个数据对象分别作为待处理数据对象。

102、对每个待处理数据对象,根据该待处理数据对象的指定业务参数在该待处理数据对象具有的各检测属性取不同属性值时的取值,获取该待处理数据对象的异常度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610055212.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top