[发明专利]一种引入自注意力机制的知识查询网络模型在审
申请号: | 202111560167.X | 申请日: | 2021-12-20 |
公开(公告)号: | CN114266340A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 程艳;吴刚;陈豪迈;项国雄 | 申请(专利权)人: | 江西师范大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F16/33;G06Q50/20 |
代理公司: | 深圳至诚化育知识产权代理事务所(普通合伙) 44728 | 代理人: | 刘英 |
地址: | 330000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 引入 注意力 机制 知识 查询 网络 模型 | ||
1.一种引入自注意力机制的知识查询网络的深度知识追踪模型其特征在于:首先利用知识状态编码器中的长短期记忆网络提供的位置信息来建模学生交互序列的前后关系,再通过自注意力机制关联单个序列的不同位置以计算序列的表示来获得更加准确的学生历史做题记录内部关键特征,然后将自注意力层得到的结果编码成知识状态向量。最后,模型利用技能编码器的多层感知机得到的技能向量与知识编码器得到的知识状态向量进行向量点积来模拟知识状态与知识点的相互作用并输入到sigmoid函数中得到学生下一问题的正确作答概率。损失函数中引入了加入了对应重构问题的正则化项以增强模型预测的一致性进而解决其存在的重构错误。
2.根据权利要求1所述的一种引入自注意力机制的知识查询网络模型其特征在于:所述知识状态编码器在保留了长短期记忆网络建模序列的能力的同时,利用自注意力机制自动关注学生历史交互序列中对预测结果影响更大的做题记录,提取更为准确的学生知识状态相关特征。
3.根据权利要求1所述的一种引入自注意力机制的知识查询网络模型其特征在于:所述加入对应重构问题的正则化项是通过考虑到预测和当前学生知识状态与技能之间相互作用的损失来规范原模型。
4.根据权利要求1所述的一种引入自注意力机制的知识查询网络模型其特征在于:所述学生知识状态编码器的输入学生交互序列和技能编码器的输入技能均被编码成独热编码向量。
5.根据权利要求1所述的一种引入自注意力机制的知识查询网络模型其特征在于:所述学生知识状态编码器的输出学生知识状态向量和技能编码器的输出技能向量的点积作用是符合现实世界中学生作答问题时是基于自身知识状态结合题目进行答题的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西师范大学,未经江西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111560167.X/1.html,转载请声明来源钻瓜专利网。