[发明专利]密集文本的检测方法及装置在审
申请号: | 202110944167.3 | 申请日: | 2021-08-17 |
公开(公告)号: | CN115880706A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 赵佳鹏 | 申请(专利权)人: | 广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司 |
主分类号: | G06V30/414 | 分类号: | G06V30/414;G06V30/148;G06V10/764;G06V10/82;G06V10/766;G06N3/045;G06N3/0442;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;臧建明 |
地址: | 510530 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了一种密集文本的检测方法及装置,属于图像检测技术领域。该文本检测模型的训练方法包括:获取密集本文图像,密集文本图像中包含有文字之间密集排列的密集文本,密集文本上标注有文本框;将密集本文图像中的文本框切割为多个子文本框;将密集本文图像和子文本框作为样本数据集,对文本检测模型进行训练;将待检测图像输入文本检测模型中,并获取文本检测模型输出的待检测图像的初步预测文本框。本申请实施例以切割的子文本框为单位进行文本检测模型的训练,在保证密集文本的检测效果的同时,降低了训练时的运算量,提高了针对密集本文的文本检测模型的训练速度。 | ||
搜索关键词: | 密集 文本 检测 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司,未经广州视源电子科技股份有限公司;广州视源人工智能创新研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110944167.3/,转载请声明来源钻瓜专利网。