[发明专利]一种基于深度学习的汉字书写质量评价方法在审
申请号: | 202011618684.3 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112633432A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 孙进军;潘勇;于卫星 | 申请(专利权)人: | 浙江优学智能科技有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/04;G06N3/08 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 陈琦;陈继亮 |
地址: | 313200 浙江省湖州市德清县*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 汉字 书写 质量 评价 方法 | ||
一种基于深度学习的汉字书写质量评价方法,所述该方法包括如下步骤:步骤一:收集手写汉子并建立字库,采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等,本发明通过深度的学习卷积神经网络Deep‑CNN结构,让AI可以更充分的接触到更多的文字和图形,并且这种文字和图形是通过大量的收集获得,可以是用户在学习的时候比对更加详细,通过大数据来实现文字的测评。
技术领域
本发明涉及一种基于深度学习的汉字书写质量评价方法,属于智能测评领域。
背景技术
AI是很常见的一种互联网智能系统,人们在各种场景均有具体的运用,如城市交通指挥,铁路运输指挥等等,但是这些都是大型的设备上使用,AI也是通过大量的数据,经过学习和锻炼形成的一种高速运转的智能系统,这些系统均是可以有意可循的,可以找的到规律的,某些没有规律的东西,比如字体,每个人写出来的字体均是不一样的,每个人对字体的审美也均不同,但是怎么通过一个不规律的东西能够体现出大家都觉得漂亮的字体,这个仅仅只是AI来判断是非常难的。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种可行的方法,简单的步骤,将没有规律的可寻的文字变换成一个可以通过智能AI来实现测评的方法:
本发明的目的是通过如下技术方案来完成的,一种基于深度学习的汉字书写质量评价方法,所述该方法包括如下步骤:
步骤一:收集手写汉子并建立字库
采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等。
步骤二:基于生成对抗神经网络GAN的数据扩展
在以上小规模以标注数据集基础上,使用半监督深度学习模型。通过将循环神经网络和生成式对抗网络GAN相结合的方法使循环神经网络学习到数据的标注关系和特征,使生成式对抗网络产生GAN合理数据进而扩展数据集。后经过数据处理等工作,形成可用于模型训练的可靠数据集,缓解了和补齐数据集紧缺的问题。此后,使用深度学习卷积神经网络Deep-CNN结构;
步骤三:深度学习卷积神经网络Deep-CNN结构
步骤四:训练数据生成模型
通过对大量的标注信息的手写汉字集的训练,提取评价汉字书写质量的特征,如汉字的结构特征、形态特征、重心特征、笔画特征、偏旁特征、和标准模版字的相似度特征以及汉字的整体书写质量特征。
步骤五:测试模型的准确率
利用第一步收集并标注字库的一部分作为测试集来检验通过训练得到的模型的准确率。
步骤六:使用模型评价汉字书写质量
提取用户书写的汉字然后通过此模型可得到该汉字书写质量的评分和评价,如结构、形态、重心、笔画、偏旁、与标准模版字相似度等方面的分数和书写评价,以及汉字的整体书写分和评价。
通过深度的学习卷积神经网络Deep-CNN结构,让AI可以更充分的接触到更多的文字和图形,并且这种文字和图形是通过大量的收集获得,可以是用户在学习的时候比对更加详细,通过大数据来实现文字的测评。
具体实施方式
下面对本发明作详细的介绍:一种基于深度学习的汉字书写质量评价方法,所述该方法包括如下步骤:
步骤一:收集手写汉子并建立字库
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江优学智能科技有限公司,未经浙江优学智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011618684.3/2.html,转载请声明来源钻瓜专利网。