[发明专利]基于逐步回归去除因式分解机交叉项的方法在审
申请号: | 201910083814.9 | 申请日: | 2019-01-18 |
公开(公告)号: | CN109816491A | 公开(公告)日: | 2019-05-28 |
发明(设计)人: | 张发恩;陈斌斌;周鹏程 | 申请(专利权)人: | 创新奇智(北京)科技有限公司 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06;G06F16/9535 |
代理公司: | 北京中企鸿阳知识产权代理事务所(普通合伙) 11487 | 代理人: | 李斌 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 逐步回归 交叉项 因式分解 检验 去除 剔除 显著性检验 计算效率 线性回归 因子分解 引入 共线性 外部 改进 | ||
1.一种基于逐步回归去除因式分解机交叉项的方法,其特征在于,包括以下步骤:
S1,根据因式分解机FM公式,引入交叉项;
S2,查取F分布表,设定自由度,根据设定的自由度分别设定引入交叉项和删除交叉项的偏F显著性检验水平的临界值;
S3,利用逐步回归法,逐项检验交叉项的F检验水平;当引入交叉项时,在已引入的交叉项中,计算全部自变量的贡献值V’;在已引入的交叉项中选取具有最小贡献值V'的一个并计算其F值,并将该交叉项的F值与临界值进行比较;判断该交叉项的显著性;如果该交叉项不显著,则将其从回归方程中删除,进入步骤S4;如果显著,则从未引入的交叉项中再选出具有最大贡献值V'的一个交叉项并计算F值,再次检验该交叉项的显著性;如果该交叉项显著,应将其引入回归方程,进入步骤S4;如果该交叉项不显著,表示已无交叉项可选入方程,则逐步计算阶段结束;
S4,剔除或引入一个交叉项后,利用矩阵变换将交叉项的系数进行消去,直至逐步计算结束完成FM交叉项的去除;利用SGD求解线性回归公式的参数。
2.根据权利要求1所述的基于逐步回归去除因式分解机交叉项的方法,其特征在于,在步骤S1中,所述FM公式为预测结果其中,w0和wi为该公式线性部分的权重因子;n表示样本总数量;<vi,vj>表示组合特征的权重因子;xi为输入样本的各个特征;xi xj代表组合特征,xi xj为交叉项。
3.根据权利要求1所述的基于逐步回归去除因式分解机交叉项的方法,其特征在于,在步骤S2中,当引入交叉项时,设定偏F显著性检验水平的临界值为F1;当删除交叉项时,设定偏F显著性检验水平的临界值为F2。
4.根据权利要求3所述的基于逐步回归去除因式分解机交叉项的方法,其特征在于,在步骤S2中,如果已引入的交叉项中最小贡献值V'的F值<偏F显著性检验水平的临界值F2,表示该交叉项不显著,应将其从回归方程中剔除。
5.根据权利要求3所述的基于逐步回归去除因式分解机交叉项的方法,其特征在于,如果已引入的交叉项中最小贡献值V'的F值F>F2,则从未引入的交叉项中选出具有最大V'值的一个并计算F值,如果F>F1,则表示该交叉项显著,应将其引人回归方程;如果F<F1,表示已无交叉项可选入方程,则逐步计算阶段结束。
6.根据权利要求1所述的基于逐步回归去除因式分解机交叉项的方法,其特征在于,在步骤S2中,设定自由度时,设定自由度=n-k-1;其中,n为原始数据观测组数,k为估计可能选人回归方程的变量个数。
7.根据权利要求1所述的基于逐步回归去除因式分解机交叉项的方法,其特征在于,
还包括步骤S5,将调整后的FM公式记为:
其中keep_set是上述步骤S1-S4计算后保留的交叉项,I{xixj∈keep_set}为示性函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(北京)科技有限公司,未经创新奇智(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910083814.9/1.html,转载请声明来源钻瓜专利网。