[发明专利]一种基于语句通顺度的自动作文评分计算方法有效
申请号: | 202010350991.1 | 申请日: | 2020-04-28 |
公开(公告)号: | CN111581392B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 郝玉洁;徐佳俊;党元;桑玉坤;李继演;伍双楠 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语句 通顺 自动 作文 评分 计算方法 | ||
本发明公开了一种基于语句通顺度的自动作文评分计算方法,该方法包括S1:句向量分布式表示;S2:句子特征提取;S3:句子间关系特征提取;S4:多层感知机模型训练预测。本发明提出了将语句通顺度指标应用到自动作文评分领域,用于实现检测发现作文中语义不通顺语句的功能,并且对作文中出现的语义无关词语和病句有更低的打分。
技术领域
本发明属于自然语言理解技术领域,尤其涉及一种基于语句通顺度的自动作文评分计算方法。
背景技术
连贯文本的结构建模是自然语言处理中的一个重要问题。连贯性是任何组织良好的文本的关键特性,它评估文本的逻辑一致性程度,帮助将一组句子按逻辑一致的顺序记录下来,这是文本生成和多文档摘要等许多文本合成任务的核心。一篇好的文章有一个特殊的高层逻辑和主题结构,实际的单词和句子选择以及它们之间的转换是为了传达文本的目的。由于连贯的概念过于抽象,难以捕捉和衡量,很难明确描述文本连贯的属性,语句通顺度计算模型试图通过学习导致句子以特定顺序出现在人类编写的文本中的高级结构来理解这些属性。
语句通顺度计算方法,目前的方法集中在以下几个方面:
(1)语义中心理论
每一个语段都表现出局部连贯性,即该语段中话语之间的连贯性,以及与语篇中其他语段的连贯性。与这两个连贯水平相对应的是注意状态的两个组成部分:语段内注意状态的局部变化模型和语段间注意状态属性的全局变化模型。中心效应被提出作为注意状态局部成分的模型,局部连贯性与指称表达式选择之间存在相互作用,连贯性的差异在一定程度上对应于特定注意状态下不同类型指称表达式对推理的不同要求。
(2)基于内容的方法
将文本视为主题序列,并在特定领域内进行主题转移,使用HMMs等条件概率模型,可以将文本主题进行建模,并提供全局一致性的支持。
(3)基于传统机器学习的方法
将输入文本编码成一组复杂的词汇和句法特征,然后应用机器学习方法(例如SVM等)来测量基于特征的这些表示之间的相干性。特征包括基于实体的特征、语法特征、命名实体特征等。但是,识别和定义这些特征始终是一个经验过程,需要大量的经验和领域专业知识。
(4)基于深度学习的方法
基于深度学习的方法通过克服传统方法的一些问题获得了显著的进步。通过对句子进行句嵌入和词嵌入编码,句子之间的语义交互作用通过深度神经网络建模,可以实现端到端的操作,自动发现重要特征。目前,包括递归神经网络,循环神经网络,卷积神经网络,基于注意力的神经网络等方法都开始应用在语句通顺度计算中,取得了较好的效果。
发明内容
本发明的目的在于,针对现有技术的不足,提出一种基于语句通顺度的自动作文评分计算方法,通过一种新颖的方式构建了图神经网络,综合了各个句子的相似度计算文档相似度,提高了模型准确性和鲁棒性,同时使用Triplet network引入第三个文档建模句子间相似度。本发明应用到自动作文评分领域,语句通顺度特征是作文评分的一个重要特征,可以对作文中出现的语义无关词语和病句有更低的打分,增加了作文评分的准确性和鲁棒性。
一种基于语句通顺度的自动作文评分计算方法,包括以下步骤:
S1:句向量分布式表示;
S2:句子特征提取;
S3:句子间关系特征提取;
S4:多层感知机模型训练预测;
所述句向量分布式表示,用于通过不同词向量分布式表示方法形成句子表示矩阵;
所述句子特征提取,用于通过卷积层和池化层提取句子特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010350991.1/2.html,转载请声明来源钻瓜专利网。