[发明专利]一种基于网络属性的电商用户分类方法在审
申请号: | 202010894196.9 | 申请日: | 2020-08-31 |
公开(公告)号: | CN112132188A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 杨旭华;陈孝则;许营坤;叶蕾 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06Q30/06 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 属性 商用 分类 方法 | ||
一种基于网络属性的电商用户分类方法,根据电商用户的购物信息使用KNN建立初始网络模型,对初始网络模型使用变分自编码器进行编码解码,通过图卷积神经网络对电商用户数据进行节点分类训练,得到分类的结果。本发明考虑了电商节点之间的拓扑关系及电商数据的内部属性,有效利用了电商网络的相关性信息,分类准确性较高。
技术领域
本发明涉及电商分类领域,特别是指一种基于网络属性的电商用户分类方法。
背景技术
随着互联网和电子商务的蓬勃发展,人类跨入了网络新时代,足不出户便能购买各地的商品。丰富的购物订单信息体现了用户多方面的数据,用户之间可以构成一张错综复杂的信息网络,利用这些数据能过够为我们生活提供了便利,更加准确地进行商品推荐,定位目标用户,为电商带来极大价值。
电商用户分类是指通过用户网络中已知的用户信息和部分用户的类别去预测电商用户网络中其他用户的类别。电商用户分类主要是基于电商网络的结构特性和电商用户的节点属性,给出节点类别的概率,然后与电商用户真实的分类标签进行对比,衡量算法的优劣性。由于电商数据庞大并且复杂,更新用户分类算法使得预测精度与效率达到满意程度就显得十分必要。由于用户之间的连边关系不能直接获得,在进行分类的同时构建一个可靠的用户网络描述用户之间的联系就显得非常重要。
发明内容
为了克服现有电商用户分类的方法没分类准确度较低、受噪声影响严重的不足,更全面地获取电商用户网络结构信息,提升现有算法的分类准确度,本发明提出了一种基于网络属性的电商用户分类方法。
本发明解决其技术问题所采用的技术具体步骤是:
一种基于网络属性的电商用户分类方法,包括如下步骤:
步骤1:统计每个电商用户包括收货地址,购买商品种类,以及金额等d项信息,用一个d维向量表示,则第i个电商用户信息向量表示为xi= [xi1,xi2,...,xid],其中第j项信息xij用一个one-hot向量表示,N个电商用户信息构成用户属性信息矩阵X={x1,x2,...,xN};计算任意两个向量的余弦相似度,进行KNN聚类,相似性高的节点之间添加边,从而得到初始的电商用户网络A,每个节点表示一个电商用户,两个节点之间如果有连边,表示这两个节点有较高的相似度;
步骤2:通过变分自编码器VGAE编码后,得到电商用户的节点嵌入向量Z= GCNμ(X,A)+∈GCNσ(X,A),GCN表示图卷积神经网络,∈是一个可调参数,GCNμ表示均值向量,GCNσ表示方差向量,再对Z进行解码,得到重建的用户网络
步骤3:计算重建的对称图网络其中
步骤4:计算本轮的电商网络结构
其中η为可调参数,表示融合新老结构的比重;
步骤5:计算嵌入向量Z的KL散度,得到图学习模块的损失值
其中,
其中,
KL[q||p]表示计算q和p的散度,q(Z|X,A)是GCN计算出的分布,p(Z)是标准高斯分布,α和β为可调参数;
步骤6:计算任意节点i,j之间的注意力系数中间值
其中,
f(·)表示的映射,W是权值矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010894196.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于空调湿度控制的方法、装置及空调
- 下一篇:一种刹车片铸造用夹具