[发明专利]手写汉字图像恢复书写轨迹的方法及设备在审
申请号: | 201911231795.6 | 申请日: | 2019-12-05 |
公开(公告)号: | CN111027451A | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 周康明 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 王奎宇;甘章乖 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 手写 汉字 图像 恢复 书写 轨迹 方法 设备 | ||
1.一种手写汉字图像恢复书写轨迹的方法,其特征在于,该方法包括:
利用动态手写汉字点坐标和点状态数据制作笔画递减的序列图片数据集;
利用所述序列图片数据集训练MCnet模型,其中,所述MCnet模型的运动编码模块中的原deep ConvLSTM模块由deep RBM模块替代;
将静态手写汉字图片输入到训练好的MCnet模型中,得到笔画逐次减少的图片序列;
按序列的从后往前的顺序,依次滤除所述笔画逐次减少的图片序列中不存在笔画的图片,得到筛选后的图片序列;
基于所述静态手写汉字图片和所述筛选后的图片序列,得到对应于所述静态手写汉字图片的书写轨迹的笔画图片序列。
2.根据权利要求1所述的手写汉字图像恢复书写轨迹的方法,其特征在于,所述动态手写汉字点坐标和点状态数据的格式如下:
[(x1,y1,s1),(x2,y2,s2),(x3,y3,s3),…,(xn,yn,sn)],
其中,xn表示xy二维平面的x坐标值,yn表示二维平面的y坐标值,xn和yn反应了手写汉字的第n个笔画的坐标点信息,sn表示手写汉字的第n个笔画的坐标点的状态,包括0、1和2三种状态,其中,0表示手写汉字的某个笔画持续,1表示手写汉字的某个笔画结束,2表示整个手写汉字的笔画结束。
3.根据权利要求1或2所述的手写汉字图像恢复书写轨迹的方法,其特征在于,利用动态手写汉字点坐标和点状态数据制作笔画递减的序列图片数据集,包括:
利用动态手写汉字点坐标和点状态数据制作黑底白字的笔画递减的序列图片数据集,得到图片的帧数为M的笔画递减的序列图片数据集,M为大于等于4的正整数,其中,当制作得到序列图片数据集中的图片的帧数为N不足M时,N为小于M的正整数,则分别用尺寸大小与制作的笔画递减的序列图片数据集中的首帧的尺寸大小相等的全黑的图片作为所述序列图片数据集N+1帧至M帧;
将图片的帧数为M的序列图片数据集中除首帧的图片和首帧的图片的后续两帧的图片之外的图片作为MCnet模型训练阶段的标签图片。
4.根据权利要求1所述的手写汉字图像恢复书写轨迹的方法,其特征在于,利用所述序列图片数据集训练MCnet模型,包括:
把图片的帧数为M的序列图片数据集中的首帧的图片与第二帧的图片的差值及所述首帧的图片与第三帧的图片的差值输入到所述MCnet模型的运动编码模块,以依次经过运动编码模块中的卷积操作模块和deep RBM模块得到第一历史帧序列的变化信息,及依次经过运动编码模块中的卷积操作模块、多尺度运动残差融合模块得到多尺度运动残差融合特征;
将图片的帧数为M的序列图片数据集中的首帧的图片输入到所述MCnet模型的内容编码模块得到第一内容编码特征,及将图片的帧数为M的序列图片数据集中的首帧的图片依次经过所述MCnet模型的内容编码模块、多尺度内容残差融合模块得到多尺度内容残差融合特征;
将所述第一历史帧序列的变化信息与和所述第一内容编码特征进行拼接,然后经过融合后,得到拼接融合特征,将所述拼接融合特征与多尺度运动残差融合特征、多尺度内容残差融合特征输入到所述MCnet模型的解码层,预测得到下一帧的图片;
将当前的预测得到的下一帧图片与对应一帧的标签图片进行比较,以计算损失,并把计算得到的损失加入到损失列表中;将图片的帧数为M的序列图片数据集中的首帧的图片与当前的预测得到的下一帧图片的真值之差输入到所述运动编码模块中,依次经过所述卷积操作模块和deep RBM模块,以提取第一运动时序特征,将所述第一运动时序特征与所述第一内容编码特征依次经过包括拼接、融合、解码的操作,以预测得到的下一帧图片;依次循环执行本步骤,直至所述损失列表中得到M-3个损失;
利用梯度下降联合优化所述损失列表中的M-3个损失,以优化所述MCnet模型中的参数,得到训练好的MCnet模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911231795.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种移膜超纤革的制备方法
- 下一篇:一种混泥土生产用搅拌装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序