[发明专利]一种基于深度学习的视频文字端到端检测与识别的方法有效
申请号: | 202110662868.8 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113361432B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 邓建华;秦琪怡;常为弘;俞泉泉;何佳霓;杨杰;李龙;代铮;郑凯文;赵建恒;陶泊昊;苟晓攀;肖正欣;余坤;陈翔;蔡竟业 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V20/62;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的视频文字端到端检测与识别的方法,属于视频文字处理技术领域。本发明的步骤包括:对待识别的视频序列段,分别对每一视频帧图像进行图像尺寸归一化处理,以使得预处理后的图像尺寸与端到端的文字检测与识别网络的输入相匹配;将预处理后的图像依次输入至端到端的文字检测与识别网络,获取待识别的视频序列段的文字识别结果。本发明实现了视频文字端到端的检测与识别,规避了多模块目标不一致而导致误差累积等固有缺陷,减少了工程复杂度。还通过共享特征提取网络优化网络结构,同时由于使用了感受野较大的特征图输入到网络的识别分支中,相比于使用原图进行输入,特征图能够包含更大范围的信息,提高了识别准确率。 | ||
搜索关键词: | 一种 基于 深度 学习 视频 文字 端到端 检测 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110662868.8/,转载请声明来源钻瓜专利网。
- 上一篇:基于临床数据的特征选择方法及装置
- 下一篇:一种带止回阀的防爆电磁阀