[发明专利]检测口语考试作弊的方法及系统有效
申请号: | 201210590964.7 | 申请日: | 2012-12-31 |
公开(公告)号: | CN103065642A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 王士进;何婷婷;刘丹;胡国平;胡郁;刘庆峰 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G10L25/06 | 分类号: | G10L25/06;G10L15/07 |
代理公司: | 北京汇智胜知识产权代理事务所(普通合伙) 11346 | 代理人: | 朱登河 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 口语 考试 作弊 方法 系统 | ||
技术领域
本发明涉及语音数据处理技术领域,具体涉及一种检测口语考试作弊的方法及系统。
背景技术
近年来随着社会经济的不断发展和全球化趋势的加剧,人们对语言学习的热情达到了前所未有的高度。相应的作为检测教学质量、检验学习效果的语言评测对评估客观性、公正性以及规模化测试的评估效率也提出了越来越高的要求。传统的基于人工打分的口语水平评测方法使教师和学生在教学时间和空间上受到很大限制,在师资力量、教学场地、经费支出等方面也存在诸多硬件上的差距和不平衡,对此基于计算机的大规模口语测试开始流行,出现了诸如四六级考试、TOFEL机考等。然而随着基于计算机的大规模口语测试的普及和推广,作弊替考的事件也时有发生。在传统考试中对考试作弊检测主要还是通过监考人员现场监督的方式,然而如果无法及时在当场发现事后基本没有方法再去检测。
发明内容
本发明提供一种检测口语考试作弊的方法及系统,以保证在监考阶段没有监考人员监测到,也可以在成绩发布之前进行快速、精确的作弊检测,保证口语考试的公平客观性。
为此,本发明提供如下技术方案:
一种检测口语考试作弊的方法,包括:
提取所有考生的考生语音数据,所述考生语音数据包括考试前的测试音数据和考题录音数据;
根据所述考生语音数据确定各考生的疑似作弊数据集;
根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测,得到作弊检测结果。
优选地,所述根据所述考生语音数据确定各考生的疑似作弊数据集包括:
针对每个考生,从所述考生的考生语音数据中提取比对特征;
基于所述比对特征确定所述考生语音数据的代表模型;
根据所述代表模型计算不同考生语音数据之间的距离;
根据所述不同考生语音数据之间的距离确定所述考生的疑似作弊数据集。
优选地,所述基于所述比对特征确定所述考生语音数据的代表模型包括:
提取所述考生语音数据中比对特征矢量集合的类中心作为所述考生语音数据的代表模型;或者
利用所述考生语音数据中比对特征矢量集合训练得到一个高斯混合模型,并将所述高斯混合模型作为所述考生语音数据的代表模型。
可选地,所述根据所述不同考生语音数据之间的距离确定所述考生的疑似作弊数据集包括:
选择与所述考生的考生语音数据距离小于设定距离门限的数据生成所述考生的疑似作弊数据集;或者
选择与所述考生的考生语音数据距离最小的前预定个数的数据生成所述考生的疑似作弊数据集。
优选地,所述方法还包括:
在根据所述考生语音数据确定各考生的疑似作弊数据集之前,从提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据;
所述根据所述考生语音数据确定各考生的疑似作弊数据集包括:
根据所述需要比对的考生语音数据确定各考生的疑似作弊数据集。
可选地,所述从提取的所有考生的考生语音数据中筛选出需要比对的考生语音数据包括:
从提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限的考生语音数据作为需要比对的考生语音数据;或者
从提取的所有考生的考生语音数据中筛选出考生有效语音数据量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据;或者
从提取的所有考生的考生语音数据中筛选出考分高于设定的分值门限并且考生有效语音量高于设定的数据规模门限的考生语音数据作为需要比对的考生语音数据。
可选地,所述根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测,得到作弊检测结果包括:
基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度;
如果所述相关度高于设定的作弊分值门限,则确定所述考生的考生语音数据为作弊数据。
可选地,所述根据所述考生的疑似作弊数据集对所述考生的考生语音数据进行复测,得到作弊检测结果包括:
基于考题录音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度;
基于测试音数据计算所述考生的考生语音数据和所述考生的疑似作弊数据集中的其他考生的考生语音数据间的相关度;
对基于考题录音数据计算得到的相关度和基于测试音数据计算得到的相关度进行融合,得到综合得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210590964.7/2.html,转载请声明来源钻瓜专利网。