[发明专利]用户画像模型的构建系统有效

专利信息
申请号: 202110914043.0 申请日: 2021-08-10
公开(公告)号: CN114119057B 公开(公告)日: 2023-09-26
发明(设计)人: 侯本忠;张永强;唐戈燕;刘甜甜;张帆;田桂申;宋猛;白雪娇 申请(专利权)人: 国家电网有限公司;国家电网有限公司大数据中心;国网内蒙古东部电力有限公司
主分类号: G06Q30/0201 分类号: G06Q30/0201;G06Q30/0203;G06F18/23;G06F18/241;G06N3/04;G06N3/08;G06N20/00
代理公司: 北京安博达知识产权代理有限公司 11271 代理人: 徐国文
地址: 100031 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户 画像 模型 构建 系统
【权利要求书】:

1.一种用户画像模型的构建系统,其特征在于,包括:

数据采集模块,用于利用词袋模型获取待分析用户的历史数据;

特征构建模块,用于基于所述历史数据构建用户特征库;

特征提取模块,用于对所述用户特征库进行特征提取,得到用户关键特征子库;

特征选择模块,用于对所述用户关键特征子库进行降维,并确定其索引标签,生成用户画像标签库;

模型确定模块,用于基于神经网络算法对所述用户画像标签库进行训练;根据多个时间区间的训练数据的权重值,对每一时间区间的训练数据的索引标签进行训练,得到用户画像模型;

所述每一时间区间的训练数据的索引标签进行训练,进一步包括:

获取第ω个时间区间的特征数据Πω,将Πω投影到内积空间

设置WGTω的训练的目标函数:

式中,U为稀疏项约束参数,λ为索引标签Πω中聚类约束参数,Sω为第ω个时间区间内积空间训练数据向量的评价矩阵,其第k行表示内积空间训练数据向量在构造标签中每个特征数据的权重值,特征数据标签

对所述目标函数进行求解,即首先随机生成初始矩阵对WGTω和Sω,其中,WGTω是Nω×TY矩阵,Sω是TY×Nω矩阵,TY是标签熵值;然后,相互迭代地更新WGTω和Sω,求解最优的权重值矩阵WGTω和评价矩阵Sω,使得目标函数值最小,将每个时间区间的训练数据的权重值矩阵WGTω分别赋值到一个空矩阵当中,获得合成的权重值矩阵WGT,该权重值矩阵即为索引标签。

2.根据权利要求1所述的系统,其特征在于,所述数据采集模块,进一步配置为:

利用词袋模型获取待分析用户的历史文本数据。

3.根据权利要求2所述的系统,其特征在于,所述词袋模型包括输入层、隐藏层和输出层;所述输入层将每个文本中的单词映射到向量中,将文本编码和IDF值组成特征向量;所述隐藏层中设置有加权矩阵,用于学习文本中的隐藏信息,并且对隐藏层向量和输入层向量进行合并;所述输出层接收合并后的向量,最后计算属于每个分类的概率。

4.根据权利要求3所述的系统,其特征在于,所述IDF值通过以下方式计算:

TF-IDF(t,d)=TF(t,d)×IDF(t)

式中,TF-IDF(t,d)为单词t在文档d中的权重,TF(t,d)为单词t在文档d中出现的频率,IDF(t)是逆文档频率,用于衡量单词t对表达语义所起的重要性,N为文章总数,N′为包含单词t的文章总数。

5.根据权利要求1所述的系统,其特征在于,所述特征构建模块,进一步配置为:

从所述历史数据中从用户特征数据的全部维度中选择一个或多个维度的用户特征数据;

将多个所述用户特征数据基于数据分类创建用户特征库。

6.根据权利要求1所述的系统,其特征在于,所述特征提取模块,进一步配置为:

采用主成分分析法从所述用户特征库中获取每个用户的关系特征、时间特征和关联度特征;

根据所述关联度特征从所述用户特征库中选取多个关键特征数据,并基于多个所述关键特征数据创建用户关键特征子库。

7.根据权利要求1所述的系统,其特征在于,所述特征选择模块,进一步配置为:

采用信息增益算法计算所述用户关键特征子库中的属性特征数据信息增益;

基于所述信息增益从用户特征数据的全部维度中选择一个或多个维度的用户特征数据;

利用逻辑回归算法生成每个用户特征数据的键值对,形成索引标签;

基于所述用户特征数据以及索引标签确定用户画像标签库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司;国家电网有限公司大数据中心;国网内蒙古东部电力有限公司,未经国家电网有限公司;国家电网有限公司大数据中心;国网内蒙古东部电力有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110914043.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top