[发明专利]基于SFT-ALS的时间序列粉丝涨幅预测方法有效
申请号: | 202110188635.9 | 申请日: | 2021-02-19 |
公开(公告)号: | CN112862195B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 曲爱妍;吴秋玲;黄丹丹 | 申请(专利权)人: | 金陵科技学院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/126;G06F16/2458;G06F17/15;G06F17/16;G06F17/18 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 蒋昱 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 sft als 时间 序列 粉丝 涨幅 预测 方法 | ||
1.基于SFT-ALS的时间序列粉丝涨幅预测方法,具体步骤如下,其特征在于:
步骤1,获取用户基础数据:经授权允许后,系统平台采集用户的基本信息,以及往期用户每日发布的视频数量、粉丝涨幅数据、视频点赞量、视频收藏量和视频播放量;
步骤2,数据特征提取:利用SFT获得数据缓慢变化的本质特征,同时提取数据的平均增长率特征;
步骤2中数据特征提取的过程表示为:除了将每日的视频更新量、粉丝量、视频点赞量、视频收藏量和视频播放量
作为模型的特征,同时还提取了粉丝的平均增长率,公式如下:
其中B为目前粉丝数,A为第一天粉丝数,m为年平均增长率;
步骤2中SFT提取的过程表示为:
同时提取粉丝的SFT特征,设粉丝时序信号为e(t),慢特征变量为si(t),i是信号维数,将慢特征算法的优化问题转化为:
式中,...表示对时间取平均,·s是慢特征一阶导数,对特征变量进行线性转换可得:
式中,gi(e)是慢特征算法中的映射函数,wi是负载矩阵,经过对粉丝
时序信号的白化处理,奇异值分解操作后求得负载矩阵,求得粉丝时序信号的慢特征si;
步骤3,数据预处理:为了减少模型训练时间,对采集的用户基础数据进行归一化处理;
步骤3中数据预处理的过程表示为:
为了减少模型的训练时间,对步骤2中提取用户每日的视频更新量、粉丝量、视频点赞量、视频收藏量、视频播放量、粉丝平均增长率和粉丝SFT特征分别进行归一化处理,归一化处理后的特征值区间在[-1,1],归一化公式如下:
式中,x’是归一化处理后的特征矩阵,x是步骤2中提取的特征矩阵,xmax和xmin分别特征的最大值和最小值矩阵;
步骤4,将经特征处理后的特征集组成混合矩阵送入ALS模型中进行矩阵分解,并重构混合矩阵;
步骤4中ALS模型重构混合矩阵的过程表示为:
将经过归一化处理后的特征矩阵和每日的粉丝增长量组合成混合矩阵Rm*n,n是特征数加1,m是用户数据的使用天数;步
骤4.1:把混合矩阵近似设为
式中Xm*k和是Rm*n分解得到的低维矩阵,参数k是低维矩阵的维数;
步骤4.2:为了使等式两边尽可能相等,构造交替最小二乘法的平方误差损
失函数:
式中Rui、Xu、Yi分别是Rm*n、Xm*k、Yn*k的简写,L(X,Y)是平方误差损失函数;
步骤4.3,此时矩阵分解问题可转化为求解平方误差损失函数最小:
ALS算法的关键是要找到最优的Xm*k和Yn*k,使得L(X,Y)最小,由于Xm*k和Yn*k是未知的,所以式的求解问题式非凸的,ALS算法的思路是固定其中一个矩阵,再去求解另一个矩阵,具体算法如下:
步骤4.3.1先取随机值固定Xu;
步骤4.3.2对L(X,Y)求解Yi的偏导,并令偏导为0,可求解Yi
Yi=(xTx+λI)-1xTRi (8)
步骤4.3.3再将上式求解的Yi固定,同理可求出Xu
Xu=(YTY+λI)-1YTRu (9)
步骤4.3.4不断重复步骤4.3.2和步骤4.3.3,直到L(X,Y)达到目标值或者达到最大迭代次数;
起初Xu和Yi是随机矩阵,交替最小二乘法通过不断的交替迭代,修改Xu和Yi,从而得到最终的Xu和Yi的值;求解出Xu和Yi后,通过式5重构混合矩阵,重构后的混合矩阵含有待求解的未来粉丝涨幅数量;
步骤5,使用遗传算法对不同数据源的训练模型进行寻优处理,得到最优低维矩阵的维数k;
步骤6,将训练获得的粉丝涨幅模型嵌入平台系统中,并实际应用。
2.根据权利要求1所述的基于SFT-ALS的时间序列粉丝涨幅预测方法,其特征在于:步骤5中遗传算法寻优的过程表示为:
k=GA(x′,ALS) (10)
其中,x′为数据集的特征矩阵,ALS表示数据集训练的ALS模型,GA(·)是遗传算法函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于金陵科技学院,未经金陵科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110188635.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理