[发明专利]语文结构训练方法和装置在审
申请号: | 202110152072.8 | 申请日: | 2021-02-04 |
公开(公告)号: | CN112883740A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 崔炜 | 申请(专利权)人: | 上海松鼠课堂人工智能科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/232;G06F40/253;G06F40/289;G06K9/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语文 结构 训练 方法 装置 | ||
本发明提供了语文结构训练方法和装置,其能够对任意形式的目标语文文本进行转换、字符改正、断句、语义识别、语义重复判断与标记和文本修改,从而对语文文本进行统一标准化模式的分析教学,以此提高语文教学的标准化和智能化程度,同时还改善语文教学的效率与进度和学生学习语文知识的兴趣。
技术领域
本发明涉及智能教育的技术领域,特别涉及语文结构训练方法和装置。
背景技术
语文属于一种主观性较强的学科,在语文教学中,不仅需要进行汉字词汇和中文语法知识的教学,同时还需要针对大篇幅的中文文章进行阅读理解,从而从读写两方面提高学生的语文水平。目前,对中文文章的阅读理解教学只是仅限于对中文文章进行人为段落划分和语义理解的训练,其无法对中文文章的语文结构进行标准化模式的分析教学,这不仅不利于提高语文教学的标准化和智能化程度,同时还大大地降低语文教学的效率与进度和学生学习语文知识的兴趣。
发明内容
针对现有技术存在的缺陷,本发明提供语文结构训练方法和装置,其通过对目标语文文本进行扫描,以此获得关于该目标语文文本的文本图像,再识别该目标语文文本,从而将该目标语文文本转换为可编辑形式的文本数据,并对该文本数据中的文本字符进行改正,接着识别经过该改正的所述文本数据中的所有标点符号,并根据该标点符号,对该文本数据进行断句处理,从而将该文本数据划分为若干文本短句,再对该文本短句进行语义识别,以此得到对应的文本语义信息,最后判断任意相邻的两个文本短句对应的文本语义信息之间是否存在语义重复,并根据该判断的结果,对该目标语文文本对应的文本部分进行标记,再对标记的文本部分进行修改,从而实现对该目标语文文本的纠正训练;可见,该语文结构训练方法和装置能够对纸件等形式的目标语文文本进行扫描而得到文本图像,并将该文本图像识别转换文可编辑形式的文本数据以及对该文本数据进行错别字字符的改正,再根据文本数据的标点符号进行断句以划分为若干文本短句和进行短句语义识别,最后判断任意相邻的两个文本短句之间是否存在文本语义重复,同时对存在文本语义重复的文本部分进行标记和修改,从而实现对目标语文文本的纠正训练,这样能够对任意形式的目标语文文本进行转换、字符改正、断句、语义识别、语义重复判断与标记和文本修改,从而对语文文本进行统一标准化模式的分析教学,以此提高语文教学的标准化和智能化程度,同时还改善语文教学的效率与进度和学生学习语文知识的兴趣。
本发明提供语文结构训练方法,其特征在于,其包括如下步骤:
步骤S1,对目标语文文本进行扫描,以此获得关于所述目标语文文本的文本图像,再识别所述目标语文文本,从而将所述目标语文文本转换为可编辑形式的文本数据,并对所述文本数据中的文本字符进行改正;
步骤S2,识别经过所述改正的所述文本数据中的所有标点符号,并根据所述标点符号,对所述文本数据进行断句处理,从而将所述文本数据划分为若干文本短句,再对所述文本短句进行语义识别,以此得到对应的文本语义信息;
步骤S3,判断任意相邻的两个文本短句对应的文本语义信息之间是否存在语义重复,并根据所述判断的结果,对所述目标语文文本对应的文本部分进行标记,再对标记的文本部分进行修改,从而实现对所述目标语文文本的纠正训练;
进一步,在所述步骤S1中,对目标语文文本进行扫描,以此获得关于所述目标语文文本的文本图像,再识别所述目标语文文本,从而将所述目标语文文本转换为可编辑形式的文本数据,并对所述文本数据中的文本字符进行修正具体包括:
步骤S101,对所述目标语文文本进行逐行依次扫描拍摄,以此获得关于所述目标语文文本的文本图像,并对所述文本图像的图像背景噪声进行卡尔曼滤波处理;
步骤S102,根据所述文本图像的图像色度分布状态,从所述文本图像中区分字符文本部分和空白无文本部分各自所占据的像素区域,并提取所述字符文本部分的像素区域对应的像素轮廓信息,再根据所述像素轮廓信息,生成关于所述目标语文文本对应的可编辑形式的文本数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海松鼠课堂人工智能科技有限公司,未经上海松鼠课堂人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110152072.8/2.html,转载请声明来源钻瓜专利网。