[发明专利]可信用户的识别方法及其装置在审
申请号: | 201610313361.0 | 申请日: | 2016-05-12 |
公开(公告)号: | CN107369056A | 公开(公告)日: | 2017-11-21 |
发明(设计)人: | 储晨 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 北京国昊天诚知识产权代理有限公司11315 | 代理人: | 许志勇,王中 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可信 用户 识别 方法 及其 装置 | ||
技术领域
本申请涉及计算机技术领域,尤其涉及一种可信用户的识别方法及其装置。
背景技术
目前大多数购物网站存在虚假交易的情况,这种现象造成质量或评价等一般的商品在各种搜索场景中获得较大的曝光(即搜索排名靠前)。这种情况的根本原因是,虚假交易的存在导致一些买家的行为数据并不能代表其真实的偏好,从而导致各种应用场景的模型估计与真实的情况具有偏差。
为了解决上述问题,现有技术中的一种解决方案是通过逻辑回归(logistic regression)对买家进行评分(分数表示该买家参与虚假交易的程度),人为设定一阈值,将分数小于该阈值的买家视为行为数据可信的买家。
但是,上述的技术方案中的评分方式是一种杂糅式的评分,同时人为设定的阈值并不能够精确识别可信买家,并且随着时间推移阈值准确度会降低,导致可信用户集合的虚假交易比例提高,因此有必要提出改进的技术手段解决上述问题。
发明内容
本申请的主要目的在于提供一种可信用户的识别方法及其装置,以克服现有技术中不能够有效识别可信用户的问题。
根据本申请实施例提供一种可信用户的识别方法,其包括:获取多个用户的负向分数和正向分数,所述负向分数根据用户的第一类行为数据得出、所述正向分数根据用户的第二类行为数据得出;至少根据所述负向分数,对所述多个用户进行排序得到用户序列;针对用户序列中的每个用户执行以下步骤:根据用户序列中的第一个用户到当前用户的负向分数以及用户序列的负向分数 确定第一值;及根据用户序列中的第一个用户到当前用户的正向分数以及用户序列的正向分数确定第二值;根据得到的所述第一值和所述第二值确定可信用户集合。
其中,统计用户的虚假交易业务数据得到所述第一类行为数据,统计用户的正常交易业务数据得到所述第二类行为数据。
其中,所述至少根据所述负向分数,对所述多个用户进行排序,包括:根据负向分数从小到大的顺序对所述多个用户进行排序,对于负向分数相同的用户根据其正向分数从大到小的顺序排序。
其中,所述方法还包括:根据用户序列中的第一个用户到当前用户的负向分数与用户序列的负向分数的比值确定所述第一值;根据用户序列中的第一个用户到当前用户的正向分数与用户序列的负向分数的比值确定所述第二值。
其中,所述方法还包括:对计算得到的第一值和第二值进行归一化处理。
其中,所述根据所述第一值和所述第二值确定可信用户集合包括:根据所述第一值和所述第二值构造损失函数,通过最小化损失函数计算可信阈值,并根据所述可信阈值确定可信用户集合。
根据本申请实施例还提供一种可信用户的识别装置,其包括:获取模块,用于获取多个用户的负向分数和正向分数,所述负向分数根据用户的第一类业务数据得出、所述正向分数根据用户的第二类业务数据得出;排序模块,用于至少根据所述负向分数,对所述多个用户进行排序得到用户序列;计算模块,用于针对用户序列中的每个用户执行:根据用户序列中的第一个用户到当前用户的负向分数以及用户序列的负向分数确定第一值;根据用户序列中的第一个用户到当前用户的正向分数以及用户序列的正向分数确定第二值;可信用户确定模块,用于根据得到的所述第一值和所述第二值确定可信用户集合。
其中,统计用户的虚假交易业务数据得到所述第一类行为数据,统计用户的正常交易业务数据得到所述第二类行为数据。
其中,所述排序模块进一步用于,根据负向分数从小到大的顺序对所述多个用户进行排序,对于负向分数相同的用户根据其正向分数从大到小的顺序排序。
其中,所述计算模块还用于:根据用户序列中的第一个用户到当前用户的负向分数与用户序列的负向分数的比值确定所述第一值;根据用户序列中的第一个用户到当前用户的正向分数与用户序列的负向分数的比值确定所述第二值。
其中,所述计算模块还用于,对计算得到的第一值和第二值进行归一化处理。
其中,所述可信用户确定模块进一步用于,根据所述第一值和所述第二值构造损失函数,通过最小化损失函数计算可信阈值,并根据所述可信阈值确定可信用户集合。
根据本申请的技术方案,根据获取的用户的负向分数计算用户集合的第一值、根据正向分数计算用户集合的第二值,并根据第一值和第二值确定可信用户集合。通过本申请确定的可信用户集合具有较高可信度,相比现有技术方案显著降低了可信用户的虚假交易比例。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610313361.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:订单消息的取货分配方法及装置
- 下一篇:移动云分销电商运营系统及其方法