[发明专利]不依赖人工预评分的大学英语作文自动评分系统及方法无效

专利信息
申请号: 201210251653.8 申请日: 2012-07-20
公开(公告)号: CN102831558A 公开(公告)日: 2012-12-19
发明(设计)人: 黄桂敏;周娅;曹国媛 申请(专利权)人: 桂林电子科技大学
主分类号: G06Q50/20 分类号: G06Q50/20;G06F17/27;G06F17/30
代理公司: 桂林市华杰专利商标事务所有限责任公司 45112 代理人: 巢雄辉
地址: 541004 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 不依赖 人工 评分 大学 英语 作文 自动 系统 方法
【说明书】:

技术领域

发明涉及中国高校大学英语作文的自动评分技术与方法,具体是一种不依赖人工预评分的大学英语作文自动评分系统及评分方法。

背景技术

英语作文自动评分技术的研究起源于1966年美国杜克大学的Ellis Page等人研发的PEG系统。现有的英语作文自动评分系统可以分为三类:侧重语言特征的英语作文自动评分系统,如PEG系统;侧重内容不同的英语作文自动评分系统,如IEA系统、BETSY系统;两者兼顾的英语作文自动评分系统,如e-rater系统、IntelliMetric系统、梁茂成系统等。其中PEG系统以作文中可量化参数作为自变量,以作文的最后得分作为因变量,通过评估作文中可量化参数来计算待评分作文的最后得分。IEA系统通过预评分作文样本的分数参数来评分作文,通过综合考虑待评分作文的内容质量指标与写作技巧指标来对待评分作文进行评分。IntelliMetric系统通过训练预评分作文样本构建评分模型,对利用少量待评分作文检测评分模型的信度与效度,最后利用得到的评分模型对大量待评分作文进行评分。e-rater系统首先对待评分作文中单词进行词性标注,分析待评分作文中句法结构、篇章结构和词汇使用情况,然后按照评分标准对待评作文进行评分。BETSY系统通过使用特定内容与形式的大型语言学语料库,同时把待评分作文分为优、良、及格、不及格四种分数尺度,通过把待评分作文划分到其最合适的分数尺度中来得到待评分作文最后得分。

综上所述的英语作文自动评分技术,除了e-rater系统能够评分英语作为非母语的英语作文之外,其他只能评分英语作为母语的英语作文。根据相关研究表明:它们(除e-rater系统以外)评分英语作为非母语的英语作文的结果与人工评分的结果存在明显差异。事实上,对英语作为非母语的中国大学英语作文的自动评分,至今还没有较为成功的英语作文自动评分方法。而且,中国大学英语写作要求与英语作为母语的英语作文写作要求相比,其评分标准也不完全相同。因此,采用国外现有英语作文自动评分技术,对中国大学英语作文评分,其评分结果的信度与效度不会很理想。而且,目前关于英语作文自动评分技术的研究,主要是解决大规模英语考试中英语作文的自动评分问题,通常是针对一个待评分的英语作文题目,用该题目不同分数段的人工预评分作文训练出一个评分模型,用得到的评分模型对该题目待评分作文进行评分,这种方法在评分与人工预评分作文题目相同的待评分作文时具有较好信度与效度,但是在评分作文时收集不同分数段的人工预评分作文具有一定难度。因为这种方法在每次评分一个题目的待评分作文时,都收集该题目不同分数段的人工预评分作文,所以它在实际的中国高校英语教学中推广可行性较差。因此,从中国高校英语教学出发,更迫切需要一种能够满足中国大学英语教学要求与评分标准,不依赖不同分数段的人工预评分作文的大学英语作文自动评分方法,以解决自动评分大学英语作文时,收集不同分数段的人工预评分作文困难的问题,以及为中国高校英语教学提供一种可行的大学英语作文自动评分方法,降低中国高校英语教师批阅学生大学作文的工作量,提高学生学习英语写作积极性和英语写作水平。

发明内容

本发明的目的是要提供一种不依赖人工预评分的大学英语作文自动评分系统及评分方法,该系统对大学英语作文的自动评分具有较好的评分信度和效度,可以大大减轻大学英语教师批阅学生英语作文的工作量。

实现本发明目的的技术方案是:

一种不依赖人工预评分的大学英语作文自动评分系统,该评分系统由训练作文特征词-作文矩阵生成模块、训练作文语义空间构建模块、待评分作文自动评分模块构成,训练作文特征词-作文矩阵生成模块中“构建特征词-作文矩阵”处理单元的处理结果“特征词-作文矩阵”,输入到训练作文语义空间构建模块中“构建训练作文集语义空间”处理单元,训练作文语义空间构建模块中“映射满分作文集特征词词频向量到训练作文集语义空间”处理单元的处理结果“满分作文集语义空间”,输入到待评分作文自动评分模块中“计算待评分作文分数”处理单元,系统输出待评分英语作文的分数。

所述的训练作文特征词-作文矩阵生成模块包括处理训练作文集单元,其工作流程是:

(S201)开始;

(S202)读入停用词列表;

(S203)读入训练作文集中作文;

(S204)标注训练作文集中作文的单词词性并输出它们的标注单词列表;

(S205)如果单词列表没有结束,则通过正则表达式从标注单词列表中提取一个单词;否则转(S208)操作;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210251653.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top