[发明专利]图像中文本的智能标注方法、装置及存储介质有效
申请号: | 202010118420.5 | 申请日: | 2020-02-26 |
公开(公告)号: | CN111310693B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 黄杰;袁星宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V20/70;G06V30/14;G06V30/148;G06F40/126;G06F3/0483;G06F3/0484 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 文本 智能 标注 方法 装置 存储 介质 | ||
1.一种图像中文本的智能标注方法,其特征在于,所述方法包括:
对包含文本内容的页面进行截图,得到包含所述文本内容的待标注图像;所述文本内容与目标语言匹配;
对所述页面中的文本内容进行提取,得到所述页面的目标语言文本;
对所述待标注图像进行光学字符识别,得到对应所述待标注图像的光学字符识别文本;
对所述光学字符识别文本进行文本解析,得到所述光学字符识别文本中包含的各单行文本,并分别获取各所述单行文本对应的文本标识,所述文本标识用于标识相应的单行文本;
基于所述文本标识,获取所述目标语言文本中与各所述单行文本对应的单行目标文本,将获得的各所述单行目标文本作为目标文本;
基于所述目标文本,对所述待标注图像进行文本标注,得到图像标注样本,所述图像标注样本用于供训练光学字符识别模型,以使训练得到的所述光学字符识别模型能够对输入的包含目标语言的文本的待识别图像进行文本识别,并输出对应所述目标语言的识别文本。
2.如权利要求1所述的方法,其特征在于,所述对包含文本内容的页面进行截图,得到包含所述文本内容的待标注图像,包括:
基于自动化测试工具模拟所述页面的浏览过程;
在模拟的所述浏览过程中,对所述页面进行截图,得到所述待标注图像。
3.如权利要求2所述的方法,其特征在于,所述基于自动化测试工具模拟所述页面的浏览过程,包括:
通过所述自动化测试工具模拟浏览器,并基于模拟得到的所述浏览器打开对应目标网址的页面;
调整模拟得到的所述浏览器的窗口大小至目标窗口大小;
将所述对应目标网址的页面,在所述目标窗口大小的浏览器的窗口中循环滚动,以实现对所述页面的浏览。
4.如权利要求2所述的方法,其特征在于,所述在模拟的所述浏览过程中,对所述页面进行截图,得到所述待标注图像,包括:
获取上一次对所述页面进行截图所对应的第一截图时间及截图周期;
当基于所述第一截图时间及截图周期确定第二截图时间到达时,获取所述页面对应的浏览状态;
当所述浏览状态表征未浏览至所述页面的底部时,对所述页面进行截图,得到所述待标注图像。
5.如权利要求1所述的方法,其特征在于,所述对所述页面中的文本内容进行提取,得到所述页面的目标语言文本,包括:
对所述页面中的文本内容进行提取,得到原始文本信息;
对所述原始文本信息进行字符编码,得到相应的编码文本;
对所述编码文本进行文本清洗,以过滤目标类型的符号,得到所述目标语言文本。
6.如权利要求1所述的方法,其特征在于,所述分别获取各所述单行文本对应的文本标识,包括:
分别提取各所述单行文本的首尾词,将提取的所述首尾词作为相应的单行文本的文本标识;
相应的,所述基于所述文本标识,获取所述目标语言文本中与各所述单行文本对应的单行目标文本,包括:
分别将各所述单行文本的首尾词与所述目标语言文本中的文本进行词语匹配,以基于匹配结果得到所述目标语言文本中与各所述单行文本对应的单行目标文本。
7.如权利要求1所述的方法,其特征在于,所述基于所述目标文本,对所述待标注图像进行文本标注,包括:
确定对应所述目标文本的光学字符识别文本在所述待标注图像中所处的目标位置;
将所述目标文本与所述目标位置进行绑定,以实现对所述待标注图像的文本标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010118420.5/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序