[发明专利]一种自动评阅作文的方法和装置、存储介质及终端有效
申请号: | 201710498079.9 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107291694B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 张帆;马楠;陈冬晓;刘志山;阎鹏;邓澍军;郭常圳 | 申请(专利权)人: | 北京猿力教育科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G09B7/02 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东;吴肖肖 |
地址: | 100102 北京市朝阳区广顺南大街*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动 评阅 作文 方法 装置 存储 介质 终端 | ||
1.一种自动评阅作文的方法,其特征在于,包括:
a1、加载目标作文及其对应的作文题目;
a2、提取目标作文的文本主题以及所述作文题目的题目主题;
其中,所述提取目标作文的文本主题包括:
a21、将目标作文切分成多个词语;
a22、对切分为多个词语的所述目标作文进行语言分析;
a23、根据语言分析的结果提取该目标作文的文本主题;
其中,所述根据语言分析的结果提取该目标作文的文本主题包括:
a231、根据目标作文中的标注结果,识别词语的相似度,对所述词语进行聚类,然后根据所述聚类的结果对所述目标作文的文本主题进行一次提取;
a232、根据预存的文本规律,对目标作文的文本主题进行二次提取;
a233、根据两次提取的文本主题,加权得到所述目标作文的最终的文本主题;
其中,所述提取作文题目的题目主题包括:
a24、将目标作文的作文题目切分成多个词语;
a25、对切分为多个词语的所述作文题目进行语言分析;
a26、根据语言分析的结果提取该作文题目的题目主题;
a3、将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生成分数。
2.根据权利要求1所述的自动评阅作文的方法,其特征在于,对目标作文或作文题目进行所述语言分析包括:
b1、对每一语句中的每个词语的词性进行标注,其中,所述词性包括名词、动词、形容词、代词、数词、量词、副词、介词、连词、助词、叹词、拟声词中的一个或多个的组合;
b2、识别每一语句中的名词词语的名称类型并标注,其中,所述名称类型包括人名、地名、机构名中的一个或多个的组合;
b3、对每一语句中的谓词的主语进行标注;
b4、根据每一语句中的词语间的关系,对该语句的语法进行标注;
b5、识别分词词语和词性之间的语义关联关系并标注。
3.根据权利要求1所述的自动评阅作文的方法,其特征在于,在步骤a2以后,还包括:
a4、识别所述目标作文的修辞手法;
a5、根据所述修辞手法对所述目标作文生成分数,并执行步骤a6;
在步骤a3后,还包括:
a6、将步骤a3生成的分数以及步骤a5生成的分数进行加权,得到所述目标作文最终的分数。
4.一种自动评阅作文的装置,其特征在于,包括:
加载模块,加载目标作文及其对应的作文题目;
主题提取模块,提取目标作文的文本主题以及所述作文题目的题目主题;
其中,所述主题提取模块包括:
作文词语切分模块,所述作文词语切分模块将目标作文切分成多个词语;
第一语言分析模块,所述第一语言分析模块对切分为多个所述词语的所述目标作文进行语言分析;
文本主题提取模块,所述文本主题提取模块根据语言分析的结果提取该目标作文的文本主题;
其中,所述文本主题提取模块包括:
第一主题提取模块,所述第一主题提取模块根据目标作文中的标注结果,识别词语的相似度,对所述词语进行聚类,然后根据所述聚类的结果对所述目标作文的文本主题进行一次提取;
第二主题提取模块,所述第二主题提取模块根据预存的文本规律,对目标作文的文本主题进行二次提取;
加权模块,根据两次提取的文本主题,加权得到所述目标作文的最终的文本主题;其中,所述主题提取模块还包括:
题目词语切分模块,所述题目词语切分模块将目标作文的作文题目切分成多个词语;
第二语言分析模块,所述第二语言分析模块对切分为多个词语的所述作文题目进行语言分析;
题目主题提取模块,所述题目主题提取模块根据语言分析的结果提取该作文题目的题目主题;
主题比对模块,将所述文本主题与所述题目主题进行比对,并根据比对的结果加权生成分数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力教育科技有限公司,未经北京猿力教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710498079.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种改进词向量模型的语义计算方法
- 下一篇:信息处理装置及其分词处理方法