[发明专利]图像中文本的智能标注方法、装置及存储介质有效

专利信息
申请号: 202010118420.5 申请日: 2020-02-26
公开(公告)号: CN111310693B 公开(公告)日: 2023-08-29
发明(设计)人: 黄杰;袁星宇 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06V30/413 分类号: G06V30/413;G06V20/70;G06V30/14;G06V30/148;G06F40/126;G06F3/0483;G06F3/0484
代理公司: 北京派特恩知识产权代理有限公司 11270 代理人: 刘晖铭;张颖玲
地址: 518000 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 文本 智能 标注 方法 装置 存储 介质
【权利要求书】:

1.一种图像中文本的智能标注方法,其特征在于,所述方法包括:

对包含文本内容的页面进行截图,得到包含所述文本内容的待标注图像;所述文本内容与目标语言匹配;

对所述页面中的文本内容进行提取,得到所述页面的目标语言文本;

对所述待标注图像进行光学字符识别,得到对应所述待标注图像的光学字符识别文本;

对所述光学字符识别文本进行文本解析,得到所述光学字符识别文本中包含的各单行文本,并分别获取各所述单行文本对应的文本标识,所述文本标识用于标识相应的单行文本;

基于所述文本标识,获取所述目标语言文本中与各所述单行文本对应的单行目标文本,将获得的各所述单行目标文本作为目标文本;

基于所述目标文本,对所述待标注图像进行文本标注,得到图像标注样本,所述图像标注样本用于供训练光学字符识别模型,以使训练得到的所述光学字符识别模型能够对输入的包含目标语言的文本的待识别图像进行文本识别,并输出对应所述目标语言的识别文本。

2.如权利要求1所述的方法,其特征在于,所述对包含文本内容的页面进行截图,得到包含所述文本内容的待标注图像,包括:

基于自动化测试工具模拟所述页面的浏览过程;

在模拟的所述浏览过程中,对所述页面进行截图,得到所述待标注图像。

3.如权利要求2所述的方法,其特征在于,所述基于自动化测试工具模拟所述页面的浏览过程,包括:

通过所述自动化测试工具模拟浏览器,并基于模拟得到的所述浏览器打开对应目标网址的页面;

调整模拟得到的所述浏览器的窗口大小至目标窗口大小;

将所述对应目标网址的页面,在所述目标窗口大小的浏览器的窗口中循环滚动,以实现对所述页面的浏览。

4.如权利要求2所述的方法,其特征在于,所述在模拟的所述浏览过程中,对所述页面进行截图,得到所述待标注图像,包括:

获取上一次对所述页面进行截图所对应的第一截图时间及截图周期;

当基于所述第一截图时间及截图周期确定第二截图时间到达时,获取所述页面对应的浏览状态;

当所述浏览状态表征未浏览至所述页面的底部时,对所述页面进行截图,得到所述待标注图像。

5.如权利要求1所述的方法,其特征在于,所述对所述页面中的文本内容进行提取,得到所述页面的目标语言文本,包括:

对所述页面中的文本内容进行提取,得到原始文本信息;

对所述原始文本信息进行字符编码,得到相应的编码文本;

对所述编码文本进行文本清洗,以过滤目标类型的符号,得到所述目标语言文本。

6.如权利要求1所述的方法,其特征在于,所述分别获取各所述单行文本对应的文本标识,包括:

分别提取各所述单行文本的首尾词,将提取的所述首尾词作为相应的单行文本的文本标识;

相应的,所述基于所述文本标识,获取所述目标语言文本中与各所述单行文本对应的单行目标文本,包括:

分别将各所述单行文本的首尾词与所述目标语言文本中的文本进行词语匹配,以基于匹配结果得到所述目标语言文本中与各所述单行文本对应的单行目标文本。

7.如权利要求1所述的方法,其特征在于,所述基于所述目标文本,对所述待标注图像进行文本标注,包括:

确定对应所述目标文本的光学字符识别文本在所述待标注图像中所处的目标位置;

将所述目标文本与所述目标位置进行绑定,以实现对所述待标注图像的文本标注。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010118420.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top