[发明专利]基于高斯约束注意力机制网络的场景文字识别方法及系统有效
申请号: | 202010767079.6 | 申请日: | 2020-08-03 |
公开(公告)号: | CN112070114B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 王伟平;乔峙;秦绪功;周宇 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06F40/30;G06V30/19;G06V10/82;G06V30/18;G06N3/0464;G06N3/0442 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 李文涛 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于高斯约束注意力机制网络的场景文字识别方法及系统,涉及图像信息识别领域,通过提取待识别图片的视觉特征,得到二维特征图;将二维特征图转化为一维特征序列,根据该一维特征序列提取全局语义信息;将全局语义信息输入至第一个时间步中初始化解码隐状态,并在每个时间步中根据隐状态和二维特征图计算原始的注意力权重,利用该权重加权求和得到原始加权特征向量;根据隐状态和原始加权特征向量构造二维高斯分布掩膜,将该掩膜与原始的注意力权重相乘,得到矫正的注意力权重,根据该权重得到矫正后加权特征向量;将原始加权特征向量和矫正后加权特征向量融合一起来预测待识别图片的字符,从而能够解决注意力弥散的情况。 | ||
搜索关键词: | 基于 约束 注意力 机制 网络 场景 文字 识别 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010767079.6/,转载请声明来源钻瓜专利网。