[发明专利]一种基于聚类和矩阵分解的事项推送方法和装置在审
申请号: | 202010793860.0 | 申请日: | 2020-08-10 |
公开(公告)号: | CN111931053A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 马晓楠;权爱荣;王雅楠 | 申请(专利权)人: | 中国工商银行股份有限公司;工银科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/906 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 徐焕;阚传猛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 矩阵 分解 事项 推送 方法 装置 | ||
1.一种基于聚类和矩阵分解的事项推送方法,其特征在于,所述方法包括:
获取目标应用在预设时间段内的用户历史行为数据;
根据所述用户历史行为数据、用户属性数据和事项标签体系,构建用户标签矩阵;
根据所述用户标签矩阵和用户历史行为数据,对所述目标应用的用户进行聚类,得到多个类别中各个类别下的用户群体簇;
从所述用户历史行为数据中获取每个类别下每个用户的历史行为信息,以确定出各个用户对事项的处理操作;
根据每个用户群体簇中各个用户对事项的处理操作,构建各个用户群体簇中用户对事项的评分矩阵,其中,一个用户群体簇对应一个评分矩阵;
通过ALS矩阵分解算法分别对每个群体簇的评分矩阵进行矩阵运算,得到运算结果矩阵;
根据所述运算结果矩阵,向所述目标应用的用户推送事项。
2.根据权利要求1所述的方法,其特征在于,根据所述用户标签矩阵和用户历史行为数据,对所述目标应用的用户进行聚类,得到多个类别中各个类别下的用户群体簇,包括:
根据所述用户标签矩阵,计算聚类成不同数量类别下,数据的平均畸变程度;
将平均畸变程度作为纵坐标,将类别数量作为横坐标,绘制得到目标曲线;
通过肘部法则从所述目标曲线中确定聚类的类别数量;
根据确定的类别数量,通过KMeans算法将所述目标应用的用户划分为所述类别数量个用户群体簇。
3.根据权利要求2所述的方法,其特征在于,根据确定的类别数量,通过KMeans算法将所述目标应用的用户划分为所述类别数量个用户群体簇,包括:
从所述用户历史行为数据中选择所述类别数量个用户的样本数据作为初始聚类中心;
计算所述用户历史行为数据中各个用户的样本数据到每个初始聚类中心的距离,并将当前用户划分至距离最小的初始聚类中心所在的类中;
在划分完成之后,再针对每个类别计算聚类中心,并将计算得到的聚类中心作为优化的聚类中心,以优化的聚类中心作为初始聚类中心进行划分和聚类中心的计算,直至计算得到的聚类中心不变化。
4.根据权利要求1所述的方法,其特征在于,根据所述用户历史行为数据、用户属性数据和事项标签体系,构建用户标签矩阵,包括:
基于业务属性,为事项划分出不同类别,以建立事项标签体系;
获取用户历史行为数据和用户属性数据;
根据所述用户历史行为数据和用户属性数据,与所述事项标签体系进行对比,以确定各个用户所应携带的标签;
根据确定的各个用户所应携带的标签,构建所述用户标签矩阵。
5.根据权利要求1所述的方法,其特征在于,根据每个用户群体簇中各个用户对事项的处理操作,构建各个用户群体簇中用户对事项的评分矩阵,包括:
对当前用户群体簇中当前用户对各个事项的处理操作进行加权累加,得到当前用户对各个事项的评分加权值;
根据当前用户群体簇中各个用户对各个事项的评分加权值,得到当前用户群体簇的评分表;
根据当前用户群体簇的评分表,构建当前用户群体簇的用户对事项的评分矩阵。
6.根据权利要求1所述的方法,其特征在于,通过ALS矩阵分解算法分别对每个群体簇的评分矩阵进行矩阵运算,得到运算结果矩阵,包括:
通过最小化损失函数对评分矩阵中为0的值进行多次迭代运算,确定出满足预设模拟条件时矩阵中为0的值得预测值;
将得到的预测值,作为评分矩阵中评分为0的项的预测值。
7.根据权利要求6所述的方法,其特征在于,所述最小化损失函数为:
其中,rui表示用户u对事项i的评分,xu表示用户u对隐含特征的偏好矩阵、yi表示事项i所包含隐含特征的矩阵,λ表示正则化系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司;工银科技有限公司,未经中国工商银行股份有限公司;工银科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010793860.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:异常报文识别方法及装置
- 下一篇:基于深度学习的界面控件测试方法及系统