[发明专利]一种作文文题一致性的测评方法有效
申请号: | 201910807298.X | 申请日: | 2019-08-29 |
公开(公告)号: | CN110705306B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 刘杰;周建设;张凯;史金生;刘丽珍 | 申请(专利权)人: | 首都师范大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06F16/33;G06F16/383;G06N3/08 |
代理公司: | 北京荟英捷创知识产权代理事务所(普通合伙) 11726 | 代理人: | 左文 |
地址: | 100048 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 作文 一致性 测评 方法 | ||
本发明公开了一种作文文题一致性的测评方法,该测评方法包括:提取待测作文特征,包括抽取待测作文的人物性格形象向量和故事描写向量;构建文题一致性判别模型,判别模型可以根据待测作文的人物性格形象特征与故事描写特征,实现两部分特征的一致度判断,完成对文题一致性的测评。本发明构建的模型可以在无监督的条件下进行训练,并对未知的作文进行文题一致性测评,从而解决了文题一致性评测模型对人工标注的依赖这一问题。本发明的测评方法准确率高,无需依赖人工标注数据,可适用于一般作文的文题一致性测评。
技术领域
本发明涉及计算机技术领域,具体地,涉及一种作文文题一致性的测评方法。
背景技术
文题一致性在作文评测中起着关键作用。目前,国内对于作文自动测评系统的设计及其算法的研究已经初步形成规模。这些研究主要采取自然语言处理技术,抽取待测作文中的文本信息,通过监督型机器学习模型,将其转化成分类或回归问题,实现作文的评级或评分。在这些研究中,用于作文评测所抽取的文本信息主要是文本的浅层特征,这是鉴于自然语言处理领域中利用浅层文本特征实现文本分类/回归任务的趋势。
现有技术虽然能实现语料库驱动的针对文本句式句群、用语习惯和词语搭配的测评,也可以实现对于全文主题的分类及主题词、特征词的提取,但对于作文文题一致性测评这一复杂任务还不能达到所要求的准确性。中小学人物类作文往往句式灵活复杂,感情丰富,主题多样且段落主题之间的关系多样灵活。所以,对于中小学人物类作文段与段的关系、每段与全文主题的关系,不仅仅需要传统的主题分析实现,也需要潜在语义模型的技术以及知识图谱的技术共同解决。
发明内容
本发明旨在提出一种作文文题一致性的测评方法,以解决文题一致性评测模型对人工标注的依赖的技术问题。
为实现上述目的,本发明采用如下技术方案,
一种作文文题一致性的测评方法,所述测评方法包括:
提取待测作文特征,包括抽取待测作文的人物性格形象向量和故事描写向量;
构建文题一致性判别模型,完成对文题一致性的测评,包括:
S1.将人物性格形象向量与故事描写向量映射到同一维度,得到相同维度的人物抽象特征和故事抽象特征;
S2.使用一层共享权值的神经网络提取抽象特征,以使人物抽象特征与故事抽象特征映射至同一个抽象特征空间内;
S3.在最终的抽象特征空间计算样本的相似度。
进一步地,在提取待测作文特征之前,包括前期步骤:
a.人工构建外貌名词词库;
b.构建外貌搭配字典;
c.人工构建性格词库,对性格词的同义词与近义词进行扩展;
d.构建指代消解程序,利用指代消解程序筛选并构建核心人物库;
e.利用特征选择技术筛选事件类关键词。
进一步地,抽取待测作文的人物性格形象向量,具体包括步骤:
S01.抽取人物出现频次向量;
S02.抽取核心人物的性格关键词特征向量;
S03.抽取核心人物的外貌搭配向量;
S04.通过逆向语义推理的方式获取待测作文核心人物的隐式性格特征向量;
S05.对步骤S01-S04的特征向量进行拼合,获得待测作文中描述核心人物的人物性格形象向量。
进一步地,抽取待测作文的故事描写向量,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于首都师范大学,未经首都师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910807298.X/2.html,转载请声明来源钻瓜专利网。