[发明专利]一种基于深度嵌入聚类算法的画像建模方法有效
申请号: | 202010313899.8 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111582912B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈锐;张彩霞;袁国文;李纲 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q30/0203;G06F18/23213;G06F18/214;G06N20/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 528000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 嵌入 算法 画像 建模 方法 | ||
本发明公开一种基于深度嵌入聚类算法的画像建模方法,包括:采集用户信息和商品信息进行聚类得到用户画像和商品画像,进行关联分析得到数据进行神经网络训练得到预测模型和预测结果;本发明针对用户基本信息和商品基本信息,应用深度聚类算法来来客户群体进行画像建模、聚类,能够处理复杂的数据,得到形象较为具体化的客户画像,增强用户体验;本发明可用于客户画像的建立。
技术领域
本发明涉及基于算法的画像建模技术领域,尤其涉及一种基于深度嵌入聚类算法的画像建模方法。
背景技术
随着电子商务近年来的不断进步和完善,商品趋于多样化而竞争趋于激烈化。要想有效保留客户、防止客户流失、提高电子商务系统的销售能力,就要提高电子商务系统的个性化,让每一个客户都觉得这个网站是为自己量身定制的。客户画像最初也是在电子商务领域得到应用的,在大数据时代背景下,客户信息充斥在网络中,将客户的每个具体信息抽象成标签,利用这些标签将客户形象具体化,从而为客户提供有针对性的服务。
聚类分析在电子商务中网站建设数据挖掘中是很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。然而传统的聚类分析算法(如k-means算法)没办法处理维度较高的复杂数据(如图像数据),无法得到形象较为具体化的客户画像。
发明内容
本发明的目的在于提出一种基于深度嵌入聚类算法的画像建模方法,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
为解决上述技术问题所采用的技术方案:一种基于深度嵌入聚类算法的画像建模方法,所述方法包括以下步骤:
S100、采集用户基本信息,采集商品基本信息,包括商品属性;通过深度嵌入聚类算法分别对用户基本信息和商品基本信息进行聚类,得到用户画像和商品画像;
S200、将用户画像和商品画像进行关联分析得到总样本,总样本分为独立的两部分:训练集和验证集,训练集占样本的75%,验证集占样本的25%;
S300、将训练集的数据输入到神经网络进行训练,得到神经网络预测模型模型;将验证集的数据输入到神经网络预测模型进行预测,得到预测结果;
S400、分析预测结果,通过深度学习算法优化神经网络预测模型;保存神经网络预测模型。
作为以上技术方案的进一步改进,步骤S100中,深入嵌入聚类算法具体为:
S101、使用去噪自编码器进行逐层贪婪训练;
S102、将去噪自编码器的编码层按顺序连接、解码层按逆序连接,形成一个栈式自编码器,对网络参数进行微调;
S103、保留栈式自编码器的编码层,移除解码层,在潜在特征空间使用K均值聚类算法对聚类质心进行初始化;
S104、使用KL散度进行迭代,调节网络参数,直到满足收敛判定准则;
其中,深入嵌入聚类算法的过程满足下式:
其中,qij表示原始空间xi经过非线性映射到潜在特征空间的嵌入点zj和聚类质心uj的相似性,也即拟合分布Q的表示,a表示学生t分布的自由度,通常取值为1,qij表达了样本xi属于类簇uj的概率;
目标分布P由拟合分布Q来定义,
拟合分布Q和目标分布P之间的KL散度为,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010313899.8/2.html,转载请声明来源钻瓜专利网。