[发明专利]基于编解码的数学公式识别方法及装置、可读存储介质在审
申请号: | 202111581067.5 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114255379A | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 周名杰;程艳云 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/82;G06K9/62;G06F17/16;G06N3/04;G06N3/08 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出基于编解码的数学公式识别方法及装置、可读存储介质,输入图片通过ResNet网络和位置编码模块进行特征的编码,紧接着使用多头注意力模型及前向网络的组合对特征序列进行解码计算实现预测避免了单字符切割和识别的步骤,能够从手写数学公式的整体信息中学习到字符间的空间关系,最终完成整个手写数学公式的识别。本发明的有益效果为:本方法编码模块中通过在ResNet网络的输出中添加位置信息,使得编码模块能够更准确地学习到公式图片的特征信息;解码模块中,不同于使用循环神经网络的方法,本方法通过使用多头注意力模型来进行并行化计算,使得运行速度得到了明显的改进。 | ||
搜索关键词: | 基于 解码 数学公式 识别 方法 装置 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111581067.5/,转载请声明来源钻瓜专利网。