[发明专利]一种基于选择性注意力机制的任意形状文本识别方法在审
申请号: | 202010807024.3 | 申请日: | 2020-08-12 |
公开(公告)号: | CN111950453A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 王勇;朱军民;曹羽 | 申请(专利权)人: | 北京易道博识科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 100083 北京市海淀区农大南路1号院2号楼7层办公A-7*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于选择性注意力机制的任意形状文本识别方法,属于计算机视觉领域。该方法包括:输入原始文本图像,对原始文本图像进行预处理,得到原始文本图像的样本集;通过融入通道Attention模块的Backbone CNN对预处理后的原始图像的特征进行编码并输出基本特征编码特征图;针对基本特征编码特征图分别进行文本图像特征编码和文本区域Mask特征编码,并进行双向特征加权融合;通过选择性注意力机制解码融合特征图;输出识别的文本信息。本发明技术方案创新性地提出选择性注意力机制,将文本图像特征的提取和序列化转录的任务集成在一个神经网络之中,大大提升了任意形状文字识别的精度。 | ||
搜索关键词: | 一种 基于 选择性 注意力 机制 任意 形状 文本 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易道博识科技有限公司,未经北京易道博识科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010807024.3/,转载请声明来源钻瓜专利网。