[发明专利]基于多因子遗传算法的多规模关键用户提取方法有效
申请号: | 201910421711.9 | 申请日: | 2019-05-21 |
公开(公告)号: | CN110162704B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 刘静;任珍妮 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06N3/08;G06N3/12 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 程晓霞;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 因子 遗传 算法 规模 关键 用户 提取 方法 | ||
本发明公开了一种基于多因子遗传算法的多规模关键用户提取方法,解决了推荐系统中不同规模关键用户同时提取的技术问题,主要步骤包括:生成候选序列集合,计算候选序列集合的多个关键用户提取任务的平均绝对误差;计算父代候选序列的能力因子和标量适应度值;对父代候选序列集合进行匹配性遗传操作;对子代候选序列集合进行选择性平均绝对误差更新;输出多个不同规模关键用户集合。本发明将多因子遗传算法中优化的种群用本发明中的关键用户候选序列集合表示,计算每个父代候选序列的能力因子和标量适应度值,对父代候选序列集合进行匹配性遗传操作,选择性更新子代候选序列集合。推荐准确率高,提取效率高。可用于网络关键信息的提取。
技术领域
本发明属于计算机和网络技术领域,更进一步涉及关注信息提取,具体是一种基于多因子遗传算法的多规模关键用户提取方法。本发明可用于同时提取推荐系统的不同规模的关键用户,利用提取的不同规模的系统关键用户及其携带的信息完成推荐过程,为系统目标用户提供准确高效的推荐。
背景技术
推荐系统是帮助用户快速发现所需物品和有用信息的工具和数据挖掘技术。在多种决策应用中,推荐系统都能够提供有用的建议。推荐系统中存在着一组携带着客观、可靠且有利于推荐过程的关键用户,提取出系统中的关键用户,利用系统关键用户携带的信息完成推荐过程,能够为系统目标用户推荐其喜欢的物品。系统目标用户就是推荐系统中接受推荐的对象。目前,已有的推荐系统关键用户提取方法主要包括以准确率为目标的贪心算法和进化算法。
Caihong Mu等人在其发表的论文“Information core optimization usingEvolutionary Algorithm with Elite Population in recommender systems”(Proceedings of the 2017IEEE Congress on Evolutionary Computation,文章编号:441-462,2017)中提出了一种基于精英保留策略的进化算法提取推荐系统关键用户的方法。该方法的实施步骤是:步骤1,构建系统用户物品评分矩阵;步骤2,父代个体种群初始化,对所有个体计算适应度;步骤3,根据M精英策略,按适应度对所有个体排序,对所有个体执行顺序交叉操作,得到系统关键用户;步骤4,利用提取的系统关键用户完成推荐过程,给出推荐结果。该方法存在的不足之处是,利用该方法提取的系统关键用户时,在同一进化过程中只能得到一种规模的关键用户,提取关键用户的效率低。
河海大学在其申请的专利文献“基于关键用户和时间上下文的二部图推荐方法”(申请号:201711190064.2,申请公布号:CN 108038746 A)中公开了一种基于关键用户和时间上下文的个性化推荐方法。该方法的实施步骤是:步骤1,采集所有用户对物品的行为反馈数据;步骤2,根据评分数量权重和用户对商品的评分样本标准差衡量用户的交易经验度和评分准确度,确定每个用户的权威度,根据用户的权威度大小来提取关键用户;步骤3,构建每个用户的兴趣偏好邻居集;步骤4,在经裁剪的二部图中进行资源扩散,并在第二步扩散过程中引入时间上下文;步骤5,为目标用户推荐将步骤4中获得资源最多且用户没有购买过的前N个物品,其中N为目标用户推荐的物品个数。该推荐方法存在的不足之处是,规定用户的权威度大小作为关键用户提取的标准,此标准根据工程实际经验制定,实际应用中获得的推荐结果准确率不高。
现有的推荐系统关键用户提取方法往往存在准确率不高且提取效率低的缺点。
发明内容
本发明的目的在于针对上述现有技术的不足,提出了一种准确率高且提取效率高的基于多因子遗传算法的提取多规模关键用户的方法。
本发明是一种基于多因子遗传算法的多规模关键用户提取方法,其特征在于,包括有如下步骤:
(1)获取数据并划分为训练集、验证集和测试集:从网上截取包含不同规模关键用户的所有用户对物品的评分数据作为基础数据,并按照60%,20%,20%的比例将基础数据划分为训练集、验证集和测试集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910421711.9/2.html,转载请声明来源钻瓜专利网。