[发明专利]用户识别方法和装置、计算机可读存储介质、电子设备有效
申请号: | 202010929369.6 | 申请日: | 2020-09-07 |
公开(公告)号: | CN112036955B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 刘洋;李嘉晨 | 申请(专利权)人: | 贝壳找房(北京)科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q50/16;G06K9/62 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 王晓多 |
地址: | 100085 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 识别 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本公开实施例公开了一种用户识别方法和装置、计算机可读存储介质、电子设备,其中,方法包括:获取待识别用户的至少一种行为数据;根据所述至少一种行为数据确定所述待识别用户的行为特征向量;利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的预测概率;其中,所述判别器基于结合生成器的对抗训练获得;本实施例获得待识别用户的至少一种行为数据,提高了行为特征向量对待识别用户的特征表达的准确性,并且,利用训练好的判别器确定待识别用户的预测概率,不需要反复训练模型分类器,降低了复杂度,提高了识别效率。
技术领域
本公开涉及用户识别技术领域,尤其是一种用户识别方法和装置、计算机可读存储介质、电子设备。
背景技术
人力成本是企业经营成本的重要组成部分,随着人力成本的不断提升,如何提升人效,成为了各大企业面临的一大难题,如何对用户进行识别,将异常用户筛选出来,从而将更多精力集中在正常用户,提高人效是现有技术需要解决的问题。例如,在房产服务领域,经纪人角色的时间分配上,在传统的房产中介场景中,获客这一环节会占据绝大比例。在获客过程中,因为贝壳是强大的线上平台,线上客源的重要性不言而喻,但客源的质量参差不齐,部分异常客户,如推销、微商、同业经纪人等,通过建立大量链接,占用经纪人的大量资源。经纪人在前期无法识别客户是否异常,导致浪费大量人力成本。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种用户识别方法和装置、计算机可读存储介质、电子设备。
根据本公开实施例的一个方面,提供了一种用户识别方法,包括:
获取设定时间段内待识别用户的至少一种行为数据;
根据所述至少一种行为数据确定所述待识别用户的行为特征向量;
利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率;其中,所述判别器基于结合生成器的对抗训练获得。
可选地,所述至少一种行为数据包括以下至少之一:线上行为数据、线下行为数据、交互行为数据。
可选地,所述利用判别器对所述行为特征向量进行判别,确定所述待识别用户对应的行为指标的预测概率之前,还包括:
基于所述生成器和所述判别器构成对抗网络,对所述对抗网络进行训练。
可选地,所述对所述对抗网络进行训练,包括:
获取第一正样本集和真负样本集;其中,所述第一正样本集中包括至少一个正样本,所述真负样本集中包括至少一个真负样本,每个所述真负样本的行为数据与所述正样本的行为数据之间的差异小于设定值;
将所述第一正样本集输入所述判别器,得到每个所述正样本对应的行为指标的第一预估异常概率;
将所述真负样本集中的每个真负样本输入到所述生成器,得到包括的至少一个第二样本的第二正样本集,并基于所述判别器确定每个所述第二样本对应的行为指标的第二预估异常概率;
基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失;
基于所述损失对所述对抗网络进行训练,得到训练后的判别器。
可选地,在基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失之前,还包括:
基于用户生命价值网络确定所述第一正样本集和所述第二正样本集中每个样本对应的正常预估概率;
所述基于所述第一预估异常概率和所述第二预估异常概率,确定所述对抗网络的损失,包括:
基于所述第一预估异常概率、所述第二预估异常概率和所述正常预估概率,确定所述对抗网络的损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳找房(北京)科技有限公司,未经贝壳找房(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010929369.6/2.html,转载请声明来源钻瓜专利网。