[发明专利]基于深度强化学习的个性化学习推荐方法有效
申请号: | 201810307140.1 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108614865B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 汤胤;黄书强;王雯 | 申请(专利权)人: | 暨南大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/901;G06Q50/20 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 刘巧霞 |
地址: | 510632 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 强化 学习 个性化 推荐 方法 | ||
1.基于深度强化学习的个性化学习推荐方法,其特征在于,包括以下步骤:
(1)定义知识点及题目的难度属性,根据知识点之间的关系构建知识点网络图;
(2)根据知识点之间的关系确定知识点下题目之间的关系,构建题目网络图;
题目网络图是指依据知识点下的题目作为节点,题目的难度属性值作为节点的题目难度属性值,题目所在的知识点难度属性值作为节点的知识点难度属性值,依据有连边的知识点下题目间关系及同一知识点下的题目间关系建立连边,题目间关系程度作为连边的权重值;
(3)根据用户行为数据,在题目网络图中得到指定用户当前状态下的子图,包括了指定期间内其作答正确和错误的节点以及邻居节点;
步骤(3)中,用户当前状态下的子图的构建方法是:根据用户行为数据,在题目网络图中依据用户行为数据找到作答过的题目节点的前向或后向节点,找到的节点及与其的连边、连边的权重构成用户当前状态下的子图;
(4)使用深度强化学习算法,利用用户历史记录建模,训练得到在用户当前状态下的子图中如何选取割集,确定选题策略并进行选题;
步骤(4)中,构建一深度强化学习模型,将用户的历史作答记录作为深度强化学习模型的状态,根据用户当前状态下的子图中节点的难度属性的选题策略作为动作集,依据用户作答的正确数确定回报值,通过一定量的答题进行深度强化学习训练,训练从用户当前状态下的子图中选取割集策略。
2.根据权利要求1所述的基于深度强化学习的个性化学习推荐方法,其特征在于,步骤(1)中,知识点的难度属性值依赖专家或用户数据建模来定义,题目的难度属性根据题目所在的知识点的难度属性值及题目自身的难度依赖专家或用户数据建模来定义。
3.根据权利要求1所述的基于深度强化学习的个性化学习推荐方法,其特征在于,步骤(1)中,知识点网络图是指依据知识点作为节点,知识点的难度属性值作为节点的难度属性值,依据知识点间的关系建立连边,知识点间关系程度作为连边的权重值,关系依赖专家或用户数据建模来定义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810307140.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:银行交易信息处理方法及装置
- 下一篇:网银客户贡献度分析方法、装置及系统