[发明专利]一种基于知识图谱的组合错题推荐方法有效
申请号: | 201710449002.2 | 申请日: | 2017-06-14 |
公开(公告)号: | CN107273490B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 杨涛;竹翠 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/9535 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于知识图谱的组合错题推荐方法,通过该方法能够精准的给学习者推荐与其薄弱知识点相关的错题。该发明包括构建从大规模非结构化试题数据中抽取知识,构建知识图谱;对学习者的错题进行文本挖掘,分词,提取出错题关键字,进而确定该错题所包含的知识点;通过对试题的语义相识性进行分析,得到该知识点的语义近邻;通过错题知识点映射到知识图谱中,获得符合其知识点的试题实体。同时通过对试题库进行相识性权重计算,得到试卷的相识度矩阵,利用协同过滤技术得到错题的推荐试题。最后,利用加权、混合、层叠和元级别等方式对两种推荐结果进行进一步组合,给出最终推荐结果。 | ||
搜索关键词: | 一种 基于 知识 图谱 组合 推荐 方法 | ||
【主权项】:
一种基于知识图谱的组合错题推荐方法,其特征在于:实现该方法包括以下五个模块;第一模块是根据试题库构建试题的知识图谱;第二模块是根据错题输入和试题库中的试题来对试题进行相似度权重计算,从而给出相应的最近邻推荐;第三模块是根据知识图谱计算试题和知识点的向量表示;第四模块是利用语义相似度,给出错题基于知识图谱中的语义近邻;第五模块是结合第二模块和第四模块中的推荐结果,利用加权、混合、层叠和元级别等方式给出最终的推荐结果;步骤一:对试题库中的每道试题进行分词操作,获取每道试题的关键字,对关键字作进一步的知识特征提取,得到每道试题所对应的知识点,由此确定知识点与试题之间的映射关系,从而构建好以各个知识点和试题为节点,关键字为边的试题知识图谱;步骤二:计算试题与知识点的相似度权重,从而获得试卷与知识点的相似度矩阵;所述相识度矩阵第i行第j列代表试题i在于知识点j所占比重;根据所述试题‑知识点矩阵,计算错题与试题库中已有试题的相似度,然后对试题进行加权排序,挑选出排序在top‑k的前k道试题作为输出,给出协同过滤所得到的最近邻推荐;步骤三:在知识图谱中,相似的节点在语义上往往也是相似的;所以,对于试题中的知识点而言,不同知识点,不同试题可能包含的语义信息是大致相同的;采用TransE算法,增强协同过滤算法中试题相似度矩阵中试题的语义信息;如图3所示:将每个试题三元组实例(head,relation,tail)中的关系relation看做从实体head到实体tail的翻译,通过不断调整h、r和t(head、relation和tail的向量),使(h+r)尽可能与t相等,即h+r≈t;在模型的训练过程中,TransE采用最大间隔方法,其目标函数如下:L=Σ(h,r,t)∈SΣ(h′,r,t′)∈S(h,r,t)′[γ+d(h+r,t)-d(h′+r,t′)]+]]>其中,S是知识库中的三元组,S'是负采样的三元组,通过替换h或t所得;γ是取值大于0的间隔距离参数,[x]+表示正值函数,即x>0时,[x]+=x;当x≤0时,[x]+=0;梯度更新只需计算距离d(h+r,t)和d(h'+r,t');采用梯度下降法,使得损失函数达到最优;当模型训练完成后,得到实体和关系的向量表示;步骤四:通过步骤三所述的TransE算法,将试题表示成为一组低维实值向量;根据TransE算法,对于错题给出其实体向量S1,然后对于试题库中的任一试题,给出任一试题的实体向量S2;对于度量两道试题间的相似度通过向量空间余弦相似度计算:cos(s1,s2)=s1·s2||s1||·||s2||]]>sim(s1,s2)=1+cos(s1,s2)2]]>sim函数的值域为(0,1),当相识度越趋近于1的时候,两个向量越表示的语义也就越相同,也就是说试题S1和S2就拥有越相同的知识点;同理,当相似度越趋近0的时候,两个向量表示的语义越不相同,即试题S1和S2就拥有越不相同的知识点;利用语义相似性进行计算,计算错题与试题库中已有试题的语义相似度,对试题进行排序,将排序在top‑k的前k道试题作为基于知识图谱的语义近邻输出;步骤五:通过步骤二和步骤四得到的试题推荐结果A和B进行整合,利用加权、混合、层叠和元级别等方式对两种推荐结果进行进一步组合,给出最终推荐结果;<1>利用加权技术进行组合推荐:对于两种推荐结果A和B作为推荐集,然后比较学习者对推荐结果的评价、与系统的预测是否相符,根据训练得到的结果生成加权的模型,动态的调整权重;根据模型给出的最合理的组合权重进行加权组合,最终输出加权组合后的推荐试题集;<2>混合操作:set(C)=set(A)+set(B)for i in set(C):print(i)其中,A、B分别为两种推荐技术给出的推荐集,C为两种推荐集的并集,i为C中的推荐试题;<3>层叠的方式进行组合推荐;层叠技术如下:i和j分别为推荐集A、B中的推荐试题;<4>利用元级别技术进行组合推荐:对于步骤二中利用协同过滤技术获得的推荐集A,将其作为输入放到步骤四种,算出A中每道拟推荐试题的与试题库中试题的语义相似度,然后排序,将前k道基于知识图谱的语义近邻推荐试题作为最终推荐。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710449002.2/,转载请声明来源钻瓜专利网。