[发明专利]一种基于深度嵌入聚类算法的画像建模方法有效
申请号: | 202010313899.8 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111582912B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈锐;张彩霞;袁国文;李纲 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q30/0203;G06F18/23213;G06F18/214;G06N20/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 528000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 嵌入 算法 画像 建模 方法 | ||
1.一种基于深度嵌入聚类算法的画像建模方法,其特征在于:所述方法包括以下步骤:
S100、采集用户基本信息,采集商品基本信息,包括商品属性;通过深度嵌入聚类算法分别对用户基本信息和商品基本信息进行聚类,得到用户画像和商品画像;
S200、将用户画像和商品画像进行关联分析得到总样本,总样本分为独立的两部分:训练集和验证集,训练集占样本的75%,验证集占样本的25%;
S300、将训练集的数据输入到神经网络进行训练,得到神经网络预测模型模型;将验证集的数据输入到神经网络预测模型进行预测,得到预测结果;
S400、分析预测结果,通过深度学习算法优化神经网络预测模型;保存神经网络预测模型;
步骤S100中,深入嵌入聚类算法具体为:
S101、使用去噪自编码器进行逐层贪婪训练;
S102、将去噪自编码器的编码层按顺序连接、解码层按逆序连接,形成一个栈式自编码器,对网络参数进行微调;
S103、保留栈式自编码器的编码层,移除解码层,在潜在特征空间使用K均值聚类算法对聚类质心进行初始化;
S104、使用KL散度进行迭代,调节网络参数,直到满足收敛判定准则;
其中,深入嵌入聚类算法的过程满足下式:
;
其中,表示原始空间经过非线性映射到潜在特征空间的嵌入点和聚类质心的相似性,也即拟合分布Q的表示,a表示学生t分布的自由度,取值为1,表达了样本属于类簇的概率;目标分布P由拟合分布Q来定义,
;
拟合分布Q和目标分布P之间的KL散度为,
。
2.根据权利要求1所述的一种基于深度嵌入聚类算法的画像建模方法,其特征在于:步骤S100中,所述用户基本信息包括:客户id、客户人像、购买商品记录、商品收藏记录、商品浏览记录、用户社会属性;所述用户社会属性包括:用户年龄、用户收入和用户信用评级。
3.根据权利要求1所述的一种基于深度嵌入聚类算法的画像建模方法,其特征在于:步骤S100中,所述商品基本信息包括商品属性;所述商品属性包括:商品类别、商品名称、商品价格和商品的联动性。
4.根据权利要求1所述的一种基于深度嵌入聚类算法的画像建模方法,其特征在于:步骤S400中,通过深度学习算法优化神经网络预测模型具体为:通过Batch-size和Learning-rate深度学习算法对神经网络模型进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313899.8/1.html,转载请声明来源钻瓜专利网。