[发明专利]同操作人识别模型的构建与同操作人识别的方法和装置有效
申请号: | 201910199958.0 | 申请日: | 2019-03-15 |
公开(公告)号: | CN109978033B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 王萌 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q20/40 |
代理公司: | 北京展翼知识产权代理事务所(特殊普通合伙) 11452 | 代理人: | 王明远 |
地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 操作 识别 模型 构建 方法 装置 | ||
1.一种同操作人识别模型的构建方法,包括:
采集多个账户的相关信息;
对采集到的多个账户的相关信息进行分析,以确定每个账户所包括的介质及其取值,所述介质用于表征多个账户在某一维度的关联载体,所述介质分为第一介质和第二介质,所述第一介质用于表征多个账户在某一维度的原始关联载体,所述第二介质是基于第一介质衍生而成的新的介质;
构建训练数据集;其中,所述训练数据集包括至少一条训练数据,每条训练数据对应一个账户对,每条训练数据的标记用于指示所对应的账户对是否为同一操作人控制,所述同一操作人是指同一自然人或同一团伙,所述构建训练数据集的步骤包括:选取共用过同一强关联介质的两个账户构成账户对,基于所构建的帐户对的相关信息构建训练数据,并根据业务反馈信息为所构建的账户对所对应的训练数据打上标记,其中,所述强关联介质是指聚集的账户数小于第一预定阈值的介质;
对所述训练数据集进行特征抽取处理,得到训练样本集;其中,所述训练样本集中的训练样本的特征包括强关联特征,所述强关联特征是指与所述账户对共用过的强关联介质相关的特征;
基于所述训练样本集构建同操作人识别模型;所述同操作人识别模型用于识别两个账户是否为同一操作人控制。
2.根据权利要求1所述的方法,其中,所述构建训练数据集的步骤还包括:
根据业务反馈信息发现账户对,基于所发现的帐户对的相关信息构建训练数据,以及为所发现的账户对所对应的训练数据打上标记。
3.根据权利要求2所述的方法,其中,所述为所发现的账户对所对应的训练数据打上标记的步骤包括:
根据账户对是否属于同一团伙,对所述账户对所对应的训练数据进行标记;其中,在所述账户对属于同一团伙的情况下,所述标记用于指示所述账户对为同一操作人控制,在所述账户对不属于同一团伙的情况下,所述标记用于指示所述账户对不为同一操作人控制;和/或
根据所述账户对中的两个账户是否均为风险账户,对所述账户对所对应的训练数据进行标记;其中,在所述账户对中的两个账户均为风险账户的情况下,所述标记用于指示所述账户对为同一操作人控制,在所述账户对中的两个账户中仅有一个账户为风险账户的情况下,所述标记用于指示所述账户对不为同一操作人控制。
4.根据权利要求1所述的方法,其中,所述账户的相关信息包括以下至少一项:
自然人信息,包括账户被注册和/或使用时获取的与自然人相关的信息;
账户信息,包括服务器端存储的与账户相关的信息;
操作信息,包括与账户产生的操作行为相关的信息;
社交信息,包括与账户对应的自然人相关的社交关系类信息;
账户作为事件被动方的信息;
与账户相关的其他信息。
5.根据权利要求1所述的方法,其中,所述构建同操作人识别模型的步骤包括:
使用有监督学习的方式进行训练,以得到同操作人识别模型;或者
基于人工经验的方式构建同操作人识别模型。
6.根据权利要求1所述的方法,其中,
所述第二介质是由所述第一介质中的部分字段组成的新的介质;
或者,所述第二介质是由多个所述第一介质组成的新的介质;
或者,所述第二介质是由第一介质基于预设的关联方式关联得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910199958.0/1.html,转载请声明来源钻瓜专利网。