[发明专利]一种基于答题统计特征的题目推荐系统有效
申请号: | 202010724420.X | 申请日: | 2020-07-24 |
公开(公告)号: | CN111881172B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 陈建海;马万腾;沈睿;周瑞祺;余林恩;何钦铭 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/2457 | 分类号: | G06F16/2457;G06F16/2458;G06K9/62;G06Q50/20;G06V10/762 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 答题 统计 特征 题目 推荐 系统 | ||
1.一种基于答题统计特征的题目推荐系统,其特征在于,包括:
题目获取模块:用于实时获取一段时间内的教学平台后台题目数据和用户练习记录数据,题目数据包括题目ID、总分、引用次数、用户ID、得分、提交时间和答题分布;同时建立题目ID、题目内容与所属知识点之间的题目ID-题目内容-知识点映射关系,所述题目内容包括试题和答案;
预处理模块:用于将题目获取模块采集到的题目数据和用户练习记录数据进行数据清洗,将清洗后的题目数据生成题目知识库;
查询特征配置模块:用于提取并配置题目知识库的题目查询特征q={xj},且j=1,2,...Q,Q为题目查询特征数量;所述的题目查询特征包括引用次数、平均提交次数、平均得分和题目难度;
用户界面:供用户输入查询的关键内容,所述关键内容包括期望查询的知识点C、期望获得的题目数量M、以及允许用户为不同的题目查询特征设置特征权重w1,w2...wQ,其中wj为题目的第j个查询特征权重,默认为1;生成查询向量r={C,M,w1,w2...wQ};
特征处理模块:读取用户界面获得的查询向量r,根据预先建立的题目ID-题目内容-知识点映射关系,选择题目知识库中位于用户查询知识点C下的所有题目ID,根据查询特征配置模块的配置结果生成题目查询特征矩阵I∈Rn×Q,n为查询知识点下的所有题目数量;对题目查询特征矩阵I进行标准化处理得到且i=1,2,...n;j=1,2,...Q,其中是标准化后的查询知识点C下第i个题目的第j个查询特征;根据查询向量r中的特征权重得到最终的查询特征矩阵
聚类计算模块:包括第一聚类单元、第二聚类单元、判断单元;
将查询特征矩阵作为第一聚类单元的输入,得到第一聚类结果;所述第一聚类结果包括类簇数K和初始类中心Θ0=[θ0,1,...,θ0,K]∈RQ×K;
将查询特征矩阵作为第二聚类单元的输入,并将第一聚类单元输出的类簇数K和类中心Θ0=[θ0,1,...,θ0,K]∈RQ×K作为第二聚类单元的目标条件,输出最终类中心Θ=[θ1,...,θk]∈RQ×K;
判断单元用于根据距离每一个题目最近的类中心判断每一个题目ID所属的类;
题目推荐模块:用于计算每一个题目ID的推荐得分值,并将所有题目ID按照推荐得分值从高到低进行排序,将前M个题目ID作为筛选结果,根据题目ID-题目内容-知识点映射关系,将M个题目ID对应的试题及所属知识点推送给用户。
2.根据权利要求1所述的一种基于答题统计特征的题目推荐系统,其特征在于,所述第一聚类单元选用DBSCAN聚类算法。
3.根据权利要求1所述的一种基于答题统计特征的题目推荐系统,其特征在于,所述第二聚类单元的计算步骤为:
步骤1:初设聚类参数s0<0,μ>1;
步骤2:计算权重:
其中,i=1,...,n;j=1,...,K;wmm,ij表示第m次迭代计算时的权重,xi表示查询特征矩阵中第i行数据的转置,为一个列向量,对应第i个题目;sm表示第m次迭代计算后的聚类参数,||·||表示范数;θm,j为类中心,下角标m是迭代计算次数,初始为0;
步骤3:更新类中心θm+1,j:
sm+1=μ·sm
步骤4:重复步骤2-3,直至收敛,将最终的类中心更新结果表示为Θ=[θ1,...,θk]。
4.根据权利要求1所述的一种基于答题统计特征的题目推荐系统,其特征在于,所述类簇数K的范围为5-10。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010724420.X/1.html,转载请声明来源钻瓜专利网。