[发明专利]一种写人作文篇章结构合理性自动评测方法有效
申请号: | 201910552305.6 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110427609B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 刘杰;余笑岩;周建设;张凯;骆力明 | 申请(专利权)人: | 首都师范大学 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/289;G06N3/08 |
代理公司: | 北京荟英捷创知识产权代理事务所(普通合伙) 11726 | 代理人: | 左文 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 作文 篇章 结构 合理性 自动 评测 方法 | ||
本发明涉及写人作文篇章结构合理性评测方法及综合评测方法,能够从结构组合和段落连贯性双重角度科学、全面的评测篇章结构合理性,并使机器评测与传统文本等级实现良好衔接。
技术领域
本发明涉及计算机技术领域,具体的,涉及一种篇章结构合理性自动评测方法。
背景技术
中文写人作文是记叙文的重要组成部分,但由于中小学生知识储备匮缺,在写作过程中常常会出现篇章结构不合理现象,因此,对篇章结构合理性评测及反馈显得尤为重要。目前,中小学作文的评价主要是人工批阅,这对于教师而言,要耗费大量的时间和精力,并且评价客观性较差,具有较大的差异性。
随着计算机硬件及软件技术的迅猛发展,计算机性能已取得了跨越式进步,计算机已应用到各行各业,并且也逐步进入作文测评领域,可以有效地减少教师工作量及增强评价的客观性。
例如,一方面,利用计算机将学生论文段落分为不同的语义块,对各个语义块进行分析,或对语义块描述的内容进行分类,可以作为辅助手段有效地协助教师快速查看、批阅作文结构及其内容。另一方面,利用计算机将作文段落进行分类描述,显示文章框架的篇章结构,也可以作为辅助手段协助学生在写作时把握文章的整体结构,为学生写作提供参考。
然而,虽然现有技术中已产生对作文段落进行语义分析及分类的相关研究,并产生了对作文整体进行评测打分的研究,但其基本上都是基于回归和分类的方法对作文进行整体评测,容易导致精确度不高的问题。而对于篇章语义评测的相关研究尚较少,对于篇章结构合理性自动评测的研究更是鲜有深入探讨。
发明内容
针对现有技术中存在的问题,本发明一方面,提供一种写人作文篇章结构合理性评测方法,其特征在于,包括篇章结构组成评测的步骤以基于该评测结果从结构组成角度评估篇章结构合理性;所述篇章结构组成评测包括待评测文本自动分类的步骤:
(a1)获取文本样本集,所述文本样本集中每一文本均包含若干段落,所述段落均具有事先确定的段落类别标签;
(a2)将所述文本样本集中的一部分文本作为训练集,另一部分作为测试集;
(a3)提取所述训练集中文本的文本特征,并与所述训练集中文本以及所述训练集中所述事先确定的段落类别标签一同输入机器学习模型中进行机器学习训练;
(a4)提取所述测试集中文本的文本特征,并与所述测试集中文本一同输入经所述训练后的机器学习模型,获得所述测试集中文本段落对应的段落类别标签;
(a5)若所述测试集中文本的所述获得的段落类别标签,相对于所述测试集中文本的所述事先确定的段落类别标签的准确率未达到第一预定准确率则返回步骤(a3)和(a4)迭代训练,直至达到所述第一预定准确率后进入步骤(a6);
(a6)将所述待评测文本集输入步骤(a5)中达到所述第一预定准确率后的机器学习模型,以获得所述待评测文本集中文本的各段落对应的段落类别标签;
其中,所述段落类别标签为:“文章开篇”、“人物描写”、“事件描写”、“总结结尾”和“其他”5类。
进一步的,在所述步骤(a3)和(a4)中,提取的文本特征均为:词性占比的特征提取、方差的特征提取和Doc2Vec的特征提取;
其中,所述词性占比的特征提取为提取文本中各段落中的名词、动词、形容词和副词占比;
所述方差的特征提取为:提取各特征词在不同类别的段落中的经归一化处理的平均偏方差V(t)归一,如下式所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910552305.6/2.html,转载请声明来源钻瓜专利网。