[发明专利]一种基于深度学习的汉字书写质量评价方法在审
申请号: | 202011618684.3 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112633432A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 孙进军;潘勇;于卫星 | 申请(专利权)人: | 浙江优学智能科技有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06N3/04;G06N3/08 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 陈琦;陈继亮 |
地址: | 313200 浙江省湖州市德清县*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 汉字 书写 质量 评价 方法 | ||
1.一种基于深度学习的汉字书写质量评价方法,其特征在于所述该方法包括如下步骤:
步骤一:收集手写汉子并建立字库
采集尽可能多不同书写质量的通用汉字手写字图,然后对每张字图进行标注,如书写质量分、字结构分、形态分、重心分、笔画分、偏旁分、与模版标准字的相似度分,以及对汉字书写的结构评语、形态评语、重记评语、笔画评语、偏旁评语、与模版相似度评语,和汉字书写整体评语等;
步骤二:基于生成对抗神经网络GAN的数据扩展
在以上小规模以标注数据集基础上,使用半监督深度学习,通过将循环神经网络和生成式对抗网络GAN相结合的方法使循环神经网络学习到数据的标注关系和特征,使生成式对抗网络产生GAN合理数据进而扩展数据集,后经过数据处理等工作,形成可用于模型训练的可靠数据集,缓解了和补齐数据集紧缺的问题,此后,使用深度学习卷积神经网络Deep-CNN结构;
步骤三:深度学习卷积神经网络Deep-CNN结构
步骤四:训练数据生成模型
通过对大量的标注信息的手写汉字集的训练,提取评价汉字书写质量的特征,如汉字的结构特征、形态特征、重心特征、笔画特征、偏旁特征、和标准模版字的相似度特征以及汉字的整体书写质量特征;
步骤五:测试模型的准确率
利用第一步收集并标注字库的一部分作为测试集来检验通过训练得到的模型的准确率;
步骤六:使用模型评价汉字书写质量
提取用户书写的汉字然后通过此模型可得到该汉字书写质量的评分和评价,如结构、形态、重心、笔画、偏旁、与标准模版字相似度等方面的分数和书写评价,以及汉字的整体书写分和评价。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江优学智能科技有限公司,未经浙江优学智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011618684.3/1.html,转载请声明来源钻瓜专利网。