[发明专利]用户识别方法、装置、设备及存储介质在审
申请号: | 202110038063.6 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112784888A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 沈易栋;万高峰;刘清;刘阳;刘子龙 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 200135 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 设备 存储 介质 | ||
本申请实施例提供一种用户识别方法、装置、设备及存储介质。该方法包括:获取用户特征样本集,其中,用户特征样本集包括多个正样本和多个负样本,且用户特征样本集中的正样本的数量小于负样本的数量;根据用户特征样本集获取至少一个子样本集,其中,子样本集包括用户特征样本集中的全部正样本,以及部分负样本,且子样本集中的正样本的数量大于或等于负样本的数量;根据至少一个子样本集分别训练至少一个预设的代价敏感分类器,得到至少一个目标分类器;集成至少一个目标分类器,得到识别能力较强的用户识别模型。进而基于该模型与目标用户的用户特征可以有效地识别目标用户正常或异常,提高用户识别效果。
技术领域
本申请涉及深度学习技术领域,尤其涉及一种用户识别方法、装置、设备及存储介质。
背景技术
为了更好地维护与用户的关系,增加用户粘性,商家通常会推出一系列优惠活动。然而商家在开展此类优惠活动的同时,也必须对活动的风险进行防范,避免活动的利益被异常用户例如“羊毛党”获取。
传统的用户识别方案通常是根据用户特征样本集训练预设模型,得到用户识别模型,通过用户识别模型来识别用户正常或异常。但是由于整体用户群体中的异常用户的占比较小,用户特征样本集中的正样本即异常用户特征的数量远低于负样本即正常用户特征的数量,正负样本不均衡,容易导致用户识别模型无法有效地识别出异常用户,识别效果较差。
发明内容
本申请实施例提供了一种用户识别方法、装置、设备及存储介质,能够使有效地识别目标用户正常或异常,提高用户识别效果。
第一方面,本申请实施例提供一种用户识别模型的训练方法,该方法包括:
获取用户特征样本集,其中,用户特征样本集包括多个正样本和多个负样本,且用户特征样本集中的正样本的数量小于负样本的数量;
根据用户特征样本集获取至少一个子样本集,其中,子样本集包括用户特征样本集中的全部正样本,以及部分负样本,且子样本集中的正样本的数量大于或等于负样本的数量;
根据至少一个子样本集分别训练至少一个预设的代价敏感分类器,得到至少一个目标分类器;
集成至少一个目标分类器,得到用户识别模型。
第二方面,本申请实施例提供一种用户识别方法,该方法包括:
获取目标用户的用户特征;
基于用户识别模型对用户特征进行识别,得到目标用户的识别结果,其中,识别结果包括目标用户正常或者目标用户异常,用户识别模型基于第一方面或者第一方面任一可实现方式中所述的用户识别模型的训练方法得到。
第三方面,本申请实施例提供一种用户识别模型的训练装置,该装置包括:
获取模块,用于获取用户特征样本集,其中,用户特征样本集包括多个正样本和多个负样本,且用户特征样本集中的正样本的数量小于负样本的数量;
获取模块,还用于根据用户特征样本集获取至少一个子样本集,其中,子样本集包括用户特征样本集中的全部正样本,以及部分负样本,且子样本集中的正样本的数量大于或等于负样本的数量;
训练模块,用于根据至少一个子样本集分别训练至少一个预设的代价敏感分类器,得到至少一个目标分类器;
集成模块,用于集成至少一个目标分类器,得到用户识别模型。
第四方面,本申请实施例提供一种用户识别装置,该装置包括:
获取模块,用于获取目标用户的用户特征;
识别模块,用于基于用户识别模型对用户特征进行识别,得到目标用户的识别结果,其中,识别结果包括目标用户正常或者目标用户异常,用户识别模型基于第一方面或者第一方面任一可实现方式中所述的用户识别模型的训练方法得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110038063.6/2.html,转载请声明来源钻瓜专利网。