[发明专利]一种去除特定字符串水印的方法及系统有效

专利信息
申请号: 202010943900.5 申请日: 2020-09-09
公开(公告)号: CN112070649B 公开(公告)日: 2022-07-22
发明(设计)人: 成俊杰;吕晨;王永哲;房鹏展 申请(专利权)人: 焦点科技股份有限公司
主分类号: G06T1/00 分类号: G06T1/00;G06T3/00;G06V30/413;G06F16/903;G06N3/04;G06N3/08
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 陈建和
地址: 210032 江苏省南京*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 去除 特定 字符串 水印 方法 系统
【说明书】:

发明公开了一种去除特定字符串水印的方法及系统,其特征在于,将待处理图片输入到文字检测模型,检测是否存在字符串水印,若存在字符串水印,则将字符串所在图片区域截取输入文字识别模型中得到相应字符串,利用正则匹配是否存在特定字符串,利用U‑net生成网络将含字符串水印的图片生成为去除字符串水印的图片,再将原图还原,有助于规避风险,高效的解决去除特定字符串水印的问题,保证网站图片符合搜索引擎优化规则,同时可以随时调整规则,快速应用,无需用户或网站编辑操作,极大的提高了效率,提高了用户体验与网站整体质量。

技术领域

本发明涉及利用水印去除领域,特别是涉及一种去除特定字符串水印的方法和系统。

背景技术

目前,电商网站平台上卖家商品展示的方式主要是以图片和文字展示为主,其中图片展示较为直观全面,深得买家的认可。因此,图片展示成为商品展示的主打展示方式之一。

对于电商平台而言,需要通过搜索引擎优化来获取更多流量,因此需要满足搜索引擎规范要求,部分搜索引擎禁止在图片中添加联系方式等水印,因此电商平台原先大量的带水印的图片需去除联系方式等水印,其他水印则可以保留,因此大量的水印图片无法通过模板方式去除,也无法要求客户自己去除特定字符串水印,同时不同时段的需要去除的字符串规则各不相同,这给电商网站平台图片处理带来了极大的挑战。

如对比文件CN202010278085-PDF所示的一种PDF图纸文字识别方法、系统以及设备,采用多种文字检测方法CTPN、Seglink、Textboxes等,其目的都是在PDF中检测出文字区域,采用CNN、CRNN方法识别文字,但传统去水印方法是基于模板的方法,往往针对使用同一模板生成的水印,去除过程也针对于该模板统一去除,往往整张图片所有水印都去除或另一未知模板生成的水印无法去除,无法做到特定字符串去除和不同模板统一去除,鲁棒性差,而本案采用优化的OCR模型,可以识别不同模板生成的不同水印字符串,同时通过正则匹配,可以选定特定的字符串,不会造成图片中所有字符的出去,鲁棒性更强,准确率更高。

此外,对于原始CRNN模型,采用的主干网络为类似VGG的神经网络,同时字符图片要求高度为32,但实际中,VGG网络特征抽取效果不够显著,同时由于字符图片高度设定为32像素,整体分辨率较低,抽取出的字符信息缺失较多,对后续解码影响较大。

发明内容

本发明所要解决的技术问题是克服现有技术的不足,提供一种去除特定字符串水印的方法和系统。

为解决上述技术问题,本发明提供一种去除特定字符串水印的方法,其特征在于,将待处理图片输入到文字检测模型,检测是否存在字符串水印,若存在字符串水印,则将字符串所在图片区域截取输入文字识别模型中得到相应字符串,利用正则匹配是否存在特定字符串,若存在特定字符串,则将字符串所在图片区域截取输入生成网络中,将该区域字符串去除,包括如下步骤:

步骤一:将待处理图片输入文字检测模型,检测是否存在字符串,若存在字符串,则返回字符串在图片中位置坐标,若不存在字符串,则返回空;

步骤二:若待处理图片含有字符串,则根据步骤一中字符串坐标,在待处理图片中截取相应字符串图片,将字符串图片输入文字识别模型,得到相应字符串;

步骤三:设定相应正则表达式,例如匹配手机号码、匹配邮箱等正则,对步骤二中识别的字符串进行匹配,若匹配成功,则返回字符串所在图片坐标;

步骤四:利用步骤三中匹配成功字符串的坐标,在待处理图片中截取相应图片,输入去水印生成网络,得到去除特定字符串水印的截图,将去除水印的截图还原到原待处理图片中,得到完整的去除特定字符串水印的图片。

所述步骤一中,采用CRAFT文字检测模型对图片中字符串进行检测,若待处理图片存在字符串,则返回字符串所在图片中的坐标;所述CRAFT文字检测模型检测单个字符串及字符串间的连接关系,根据字符串间的连接关系确定文本行。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010943900.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top