[发明专利]一种用户画像方法、装置、可读存储介质及终端设备在审
申请号: | 201910041701.2 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109784406A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 赵付利;刘建华 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 高星 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类器 特征向量 画像 特征信息 终端设备 维度 预设 计算机可读存储介质 标签 计算机技术领域 可读存储介质 标签向量 训练过程 耦合 关联性 准确率 传递 评估 | ||
1.一种用户画像方法,其特征在于,包括:
获取用户在预设的各个评估维度上的特征信息,并根据所述特征信息构造所述用户的特征向量;
将所述用户的特征向量输入到预设的分类器序列中进行处理,得到所述用户的标签向量,其中,所述分类器序列中包括两个以上的不同分类器,且各个分类器的排列顺序在训练过程中依次逐个确定,所述标签向量包括两个以上的标签维度上的标签值,每个分类器用于确定一个标签维度上的标签值。
2.根据权利要求1所述的用户画像方法,其特征在于,所述分类器序列的构造过程包括:
从预设的历史用户信息数据库中选取N个训练样本,并组成训练样本集合,N为正整数;
使用所述训练样本集合对预设的分类器集合中的各个分类器进行LN-1轮训练,每轮训练从所述分类器集合中筛选出一个分类器,LN为标签维度的总数;
将所述分类器集合中的各个分类器按照筛选出的先后顺序构造成所述分类器序列。
3.根据权利要求2所述的用户画像方法,其特征在于,所述训练样本集合中的每个训练样本均包括一个历史用户的特征向量和标签向量,即:
Samplen=(EigenVecn,LabelVecn)
其中,Samplen为所述训练样本集合中的第n个训练样本,1≤n≤N,EigenVecn为第n个训练样本的特征向量,且:
EigenVecn=(EigenValn,1,EigenValn,2,...,EigenValn,en,...,EigenValn,EN),
EigenValn,en为第n个训练样本的特征向量在第en个评估维度上的特征信息,1≤en≤EN,EN为评估维度的总数,LabelVecn为第n个训练样本的标签向量,且:
LabelVecn=(LabelValn,1,LabelValn,2,...,LabelValn,ln,...,LabelValn,LN),
LabelValn,ln为第n个训练样本的标签向量在第ln个标签维度上的标签值,1≤ln≤LN。
4.根据权利要求3所述的用户画像方法,其特征在于,使用所述训练样本集合对所述分类器集合中的各个分类器进行的第t轮训练过程包括:
根据下式对所述训练样本集合的各个训练样本的特征向量进行扩展:
ExEigenVect,n=(ExEigenVect-1,n,SelLabelValt-1,n)
其中,ExEigenVect,n为第n个训练样本在第t轮训练过程中扩展得到的特征向量,1≤t≤LN-1,特殊地,设置ExEigenVec0,n=EigenVecn,SelLabelValt,n为第n个训练样本与第t轮训练过程中筛选出的分类器对应的标签值,特殊地,设置
从所述分类器集合中分别提取出各个待筛选的分类器,其中,待筛选的分类器的总数为SNt,且SNt=LN-t+1;
使用所述训练样本集合分别对各个待筛选的分类器进行训练,其中,分类器的输入为所述训练样本集合中各个训练样本扩展得到的特征向量,输出为预测标签值;
根据所述训练样本集合中各个训练样本的预测标签值分别计算各个待筛选的分类器的分类精准度;
选取分类精准度最高的分类器作为第t轮训练过程中筛选出的分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910041701.2/1.html,转载请声明来源钻瓜专利网。