[发明专利]虚假业务识别方法、装置、设备和存储介质在审
申请号: | 201911054550.0 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110880117A | 公开(公告)日: | 2020-03-13 |
发明(设计)人: | 卢剑锋 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q30/06;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 任亚娟 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 虚假 业务 识别 方法 装置 设备 存储 介质 | ||
本申请实施例提供了一种虚假业务识别方法、装置、电子设备和存储介质,涉及数据处理技术领域。采用本申请实施例提供的虚假业务识别方法,利用分类模型预测第一待识别业务为虚假业务的第一概率后,如果第一概率处于表征疑似虚假业务的概率阈值区间,则将其加入人工标注池作进一步的人工标注,后续则可将人工标注池中的各个待识别业务作为训练样本对分类模型进行更新。在本实施例中,充分利用分类模型预测准确率高的优点,仅将处于疑似虚假业务的概率阈值区间内的第一待识别业务才加入人工标注池中,降低采样进入人工标注池的第一待识别业务的数量,减少人工标注工作量,并可提供更典型的训练样本,提高分类模型的识别效果。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种虚假业务识别方法、装置、设备和存储介质。
背景技术
互联网的蓬勃发展为人们生活带来了极大的便利,越来越多的人习惯了在网上进行交易,因此催生了越来越多的电商商户,在面对越来越多的电商商户时,如何选择合适的电商商户成了一个问题。通常电商平台会设置一些规则对电商商户进行排序,诸如按照交易量、评价、补贴等对电商商户进行排序,供用户选择。因此,电商商户为了能够排序靠前从而容易被用户选择,一些电商商户会进行虚假交易,同时网上交易匿名、快速、监管困难的特点为网上虚假交易行为的实施提供了有利条件。
由于虚假交易行为基本上不会有举报、投诉等反馈,因此对虚假交易行为而产生的虚假业务进行识别往往比较困难,现在普遍有以下三种方法:
方法一:使用规则策略法进行识别,规则策略法通过挖掘虚假业务case(事例或场景),能够有效识别相同业务类型的虚假业务,并且策略时效性强,能够快速上线,但是由于其受限于特定case,缺乏对新case的主动发现能力,同时规则策略法为了保障准确率会限定严格的阈值,导致虚假业务识别率会下降。
方法二:使用分类模型进行识别,分类模型可以有效结合多维度的虚假业务特征,学习商户历史虚假业务场景,在保障一定准确率条件下,可以比方法一规则策略法达到更高的召回率,但是其存在比较依赖虚假业务样本标注,上线时效性下降,对新虚假业务场景主动发现能力不足的缺点。
方法三:使用无监督模型进行识别,无监督模型不依赖样本标注,并且能够提高对新虚假业务场景主动发现能力,但是其上线时效性低,准确率也较低,对虚假业务识别率也不高。
现在的三种识别虚假业务的方法各有缺点,如何准确高效地对对虚假业务进行识别,是需要解决的问题。
发明内容
本申请实施例提供一种虚假业务识别方法、装置、电子设备和存储介质,以解决现有的虚假业务识别方法不能准确高效地对虚假业务进行识别的问题。
本申请实施例第一方面提供了一种虚假业务识别方法,所述方法包括:
获得一批第一待识别业务,提取所述一批第一待识别业务的特征;
将所述一批第一待识别业务的特征输入分类模型中,得到每一个第一待识别业务为虚假业务的第一概率;
根据每一个第一待识别业务为虚假业务的第一概率,将第一概率处于表征疑似虚假业务的概率阈值区间内的至少一第一待识别业务中的部分或全部加入人工标注池,对加入人工标注池内的至少一第一待识别业务进行人工标注;
将所述人工标注池中经过人工标注后的各个第一待识别业务作为训练样本,对所述分类模型进行更新;
将第二待识别业务的特征输入更新后的分类模型,得到所述第二待识别业务的是虚假业务的第二概率。
本申请实施例第二方面提供一种虚假业务识别装置,所述装置包括:
特征获得模块,用于获得一批第一待识别业务,提取所述一批第一待识别业务的特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911054550.0/2.html,转载请声明来源钻瓜专利网。