[发明专利]一种基于聚类的考试系统试题库优化方法无效
申请号: | 201210066995.2 | 申请日: | 2012-03-14 |
公开(公告)号: | CN102629272A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 姚文斌;雷鸣涛;叶鹏迪;韩司;王枞 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的是一种基于聚类的考试系统试题库优化方法。本发明的关键在于将文本聚类特征引入到考试系统的试题库优化过程中,该方法能够在未知试题库是否无重复试题的情况下,根据试题内容与词库词语的匹配程度分词,并通过计算试题与选定中心点的相似度,将相似度最接近的试题聚为一簇,并在本簇内查找重复试题进行标记。基于聚类的考试系统试题库优化方法,能够综合考虑试题库中各试题的相似情况及试题语义,对语义相似或完全相同的试题进行标记,从而有效降低了试题库的重复度;各簇内并行运行,从而大大提升了查重速度,提高了试题查重效率。 | ||
搜索关键词: | 一种 基于 考试 系统 试题库 优化 方法 | ||
【主权项】:
1.一种基于聚类的考试系统试题库优化方法,其特征是:由1个试题库、1个Web服务器、1个词库和n个用户构成的考试系统,在未知试题库是否存在重复试题时,将各试题分词并与词库中各词比对,得到中心点与各试题的分词向量,由此计算试题与各中心点的相似度,并将试题加入相似度最高点中心点所在的簇内;在输入新试题组时,依次对试题分词,并与各簇内中心点计算相似度,并将试题加入相似度最高的中心点所在的簇内;在各簇内进行相似查找,将各簇内的相似试题进行标记;词库U中各词之间的权值关系表示为wij,其中,1≤i,j≤n,0≤wij≤1;试题集合X={Z1,Z2,…,Zm},聚类半径分别为R1,R2,…,Rs,其中,m为试题总数,s为总簇数;各簇中心点分别表示为A1,A2,…,As,Al分词后得到各词表示为(Al1,Al2,…,Alh),其向量表示为其中,1≤l≤s,h为Al词总数即维数;由A1,A2,…,As为中心点的簇分别表示为V1,V2,…,Vs;第k个试题表示为Zk,Zk分词后得到各词表示为Zk1,Zk2,…,Zkh,权值表示为Qk1,Qk2,…,Qkh,其中,1≤k≤m,h表示Zk的词总数即维数;Zk的向量表示为。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210066995.2/,转载请声明来源钻瓜专利网。