[发明专利]账户识别方法和系统在审
申请号: | 201310533508.3 | 申请日: | 2013-10-31 |
公开(公告)号: | CN104598780A | 公开(公告)日: | 2015-05-06 |
发明(设计)人: | 杜玮;朱训 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F21/31 | 分类号: | G06F21/31 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 张永明;吴孟秋 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 账户 识别 方法 系统 | ||
技术领域
本申请涉及互联网安全领域,具体而言,涉及一种账户识别方法和系统。
背景技术
现有技术中通常采用有目标地训练模型的方法来实现对账户的使用者的识别,最为典型的方法包括:
1)决策树——首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。
2)评分卡模型——首先根据用户的历史资料,利用一定的信用评分模型或者算法,得到不同等级的分数或者排序,然后依据用户的分数或者排序来决定客户风险水平。
上述两种有目标地训练模型的方法通常需要预先对事实样本数据进行采集,也即,需要获知账户是否被与该账户对应的用户所使用的历史事实记录,例如,可以通过客户电话的投诉实现对事实样本数据的采集,然后依靠采集到的事实样本数据为模型同时提供输入和输出,实现对模型的训练。然而,由于这样采集来的样本的特征通常不具有代表性,从而导致得出的识别模型的准确性通常较差。此外,这种账户识别方法中的建模周期通常较长,并且在用户群体的使用习惯随时间发生变化时,通常需要重新建模,总之无论是建模还是重新建模都给系统造成了额外的开销,造成了系统资源的浪费。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种账户识别方法和系统,以至少解决由于现有的账户识别方法采用有目标地训练模型的方式所导致的需要依赖大量的事实样本数据的问题。
根据本申请的一个方面,提供了一种账户识别方法,包括:获取待识别账户的同一属性的信息一致链相关信息,并根据上述信息一致链相关信息来对上述待识别账户进行第一识别判断;至少根据上述第一识别判断的结果来判断上述待识别账户是否被与上述待识别账户对应的用户使用;其中,上述信息一致链相关信息包括以下之一:信息一致链的长度,其中,上述信息一致链包括属于上述同一属性、且内容与上述待识别账户对应的用户的注册信息相互一致的一个或多个指标,上述信息一致链的长度表示上述信息一致链中包括的上述指标的个数;上述信息一致链的长度和上述信息一致链中包含预定重要指标的个数;或者上述信息一致链的长度、上述信息一致链中包含预定重要指标的个数和上述信息一致链对应的一致指数。
可选地,上述属性包括多个,其中,上述根据上述信息一致链相关信息来对上述待识别账户进行第一识别判断包括:根据上述信息一致链相关信息获取每个上述待识别账户的每个属性对应的属性等级,其中,上述属性对应的属性等级表示基于上述属性判断出的上述待识别账户上被与上述待识别账户对应的用户使用的相对概率;根据所有上述待识别账户在每个上述属性的每个概率等级上的分布情况来判断每个上述待识别账户的广度识别等级,其中,上述待识别账户的广度识别等级表示上述待识别账户被与上述待识别账户对应的用户使用的相对概率。
可选地,上述每个属性包括第一属性,其中,上述根据上述信息一致链相关信息获取每个上述待识别账户的每个属性对应的属性等级包括:根据所有上述待识别账户的第一属性的信息一致链的长度的分布获取每个上述待识别账户的上述第一属性对应的属性等级,其中,对于所有上述待识别账户中上述信息一致链的长度相同的第一待识别账户,根据上述第一待识别账户的第一属性的信息一致链的长度的分布和上述第一待识别账户的上述第一属性的信息一致链中包含预定重要指标的个数获取上述第一待识别账户的上述第一属性对应的属性等级;对于所有上述待识别账户中上述信息一致链的长度相同且上述包含预定重要指标的个数相同的第二待识别账户,根据上述第二待识别账户的第一属性的信息一致链的长度的分布和上述第二待识别账户的上述第一属性的信息一致链中包含预定重要指标的个数以及上述信息一致链对应的一致指数获取上述第二待识别账户的上述第一属性对应的属性等级。
可选地,在上述至少根据上述第一识别判断的结果来判断上述待识别账户是否被与上述待识别账户对应的用户使用之前,上述账户识别方法包括:获取上述待识别账户的活跃时间和上述待识别账户被与上述待识别账户不对应的用户使用的占比,并根据上述活跃时间和上述占比对上述待识别账户进行第二识别判断;其中,上述至少根据上述第一识别判断的结果来判断上述待识别账户是否被与上述待识别账户对应的用户使用包括:根据上述第一识别判断的结果和上述第二识别判断的结果来判断上述待识别账户是否被与上述待识别账户对应的用户使用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司;,未经阿里巴巴集团控股有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310533508.3/2.html,转载请声明来源钻瓜专利网。