[发明专利]一种基于注意力机制的自然场景下文字识别方法在审
申请号: | 201811385056.8 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109543681A | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 张卫山;朱立倩;仵海云 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于注意力机制的自然场景下文字识别方法,包括如下步骤:制作数据集;使用由卷积神经网络,注意力机制,循环神经网络构建的网络对图片进行端到端的训练;采用反向传播和梯度下降算法对模型进行优化;利用得到的模型实现对图片文字进行端到端的识别。由于文本的字符之间一般是有联系的,这种上下文的联系可以帮助更好的识别文本。注意力机制就是一种可以很好地构建文本上下文之间联系的方法,利用注意力机制可以提高识别的准确性。基于注意力机制的自然场景下文字识别方法,将文字识别和注意力机制方法相结合,并通过特征工程提高准确率的同时加快算法速度。 | ||
搜索关键词: | 注意力机制 文字识别 自然场景 构建 文本 卷积神经网络 循环神经网络 文本上下文 反向传播 模型实现 图片文字 下降算法 数据集 准确率 算法 制作 优化 网络 帮助 图片 | ||
【主权项】:
1.一种基于注意力机制的自然场景下文字识别方法,其特征在于,数据集制作模块、文本检测模块、文本识别模块,包括以下步骤:步骤(1)、制作数据集,包括训练集和测试集,保证格式的规范性;步骤(2)、对检测部分进行预训练;步骤(3)、将检测与识别部分一起训练。调整网络参数,将图片输入基于注意力机制的网络中,卷积神经网络提取图片特征,注意力机制以及循环神经网络获得不同区域对于当前区域的重要性程度并输出最终的识别结果;步骤(4)、根据制订的训练计划(包括几组不同的训练参数),调整训练参数,重复步骤(2)和步骤(3);步骤(5)、对训练得到的多个模型的识别精度进行比较,选择精度最高的模型作为最终的识别模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811385056.8/,转载请声明来源钻瓜专利网。