[发明专利]招牌内容识别方法、装置及设备有效
申请号: | 201910003495.6 | 申请日: | 2019-01-03 |
公开(公告)号: | CN109784330B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 刘慧;吴云鹏;王洪志 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 招牌 内容 识别 方法 装置 设备 | ||
本发明提出了一种招牌内容识别方法、装置及设备,其中,方法包括:获取招牌内容,并根据招牌内容提取文字图像数据;将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型;当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;对第二类型的文字图像数据进行光学字符识别,生成识别结果。由此,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
技术领域
本发明涉及文字识别技术领域,尤其涉及一种招牌内容识别方法、装置及设备。
背景技术
目前,商家设计的招牌内容多种多样,例如,考虑到大众审美与辨识度,商家通常会在招牌内容中加入艺术字等,以吸引用户。招牌内容识别是数据自动化生成中必不可少的环节。
相关技术中,通常通过OCR(Optical Character Recognition,光学字符识别)识别招牌内容,而针对招牌中的部分象形字或艺术字,OCR识别准确率低。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种招牌内容识别方法,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
本发明的第二个目的在于提出一种招牌内容识别装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
本发明第一方面实施例提出了一种招牌内容识别方法,包括:
获取招牌内容,并根据所述招牌内容提取文字图像数据;
将所述文字图像数据输入到分类模型中进行处理,获取所述文字图像数据的字体类型;
当所述文字图像数据的字体类型为第一类型时,将所述文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据;
对所述第二类型的文字图像数据进行光学字符识别,生成识别结果。
本发明实施例的招牌内容识别方法,通过获取招牌内容,并根据招牌内容提取文字图像数据。进而将文字图像数据输入到分类模型中进行处理,获取文字图像数据的字体类型,当文字图像数据的字体类型为第一类型时,将文字图像数据输入到转换模型中进行处理,获取第二类型的文字图像数据。进一步对第二类型的文字图像数据进行光学字符识别,生成识别结果,由此,通过分类模型对文字图像数据进行分类,并将第一类型的文字图像数据输入到转换模型中,以生成OCR识别准确率较高的第二类型的文字图像数据,实现了字体类型的转换,解决了相关技术中OCR识别对于招牌文字中的象形字、艺术字等字体识别准确率较低的问题,降低了招牌文字识别难度,提高了招牌文字识别准确率。
另外,根据本发明上述实施例的招牌内容识别方法还可以具有如下附加技术特征:
可选地,所述第一类型包括象形字类型和/或艺术体类型,所述第二类型包括印刷体类型。
可选地,在将所述文字图像数据输入到分类模型中进行处理之前,还包括:获取文字图像训练数据与对应的字体类型的训练集;根据所述训练集训练预设模型的参数,生成所述分类模型。
可选地,在将第一类型的文字图像数据输入到转换模型中进行处理之前,还包括:获取所述第一类型的文字图像训练数据与对应的所述第二类型的文字图像训练数据的训练集;根据所述训练集训练预设模型的参数,生成所述转换模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910003495.6/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法