[发明专利]一种实时图像文字识别缓存加速系统在审
申请号: | 201810436632.0 | 申请日: | 2018-05-09 |
公开(公告)号: | CN108769140A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 方喆君;何跃鹰;卓子寒;张晓明;张嘉玮;赵忠华;董建武;李明哲;刘中金;孙中豪;罗冰 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | H04L29/08 | 分类号: | H04L29/08;H04L12/24;H04W4/12;G06T1/20;G06K9/20 |
代理公司: | 北京久维律师事务所 11582 | 代理人: | 邢江峰 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种实时图像文字识别缓存加速系统,包括配置管理服务器、处理结果缓存服务器和若干个图像文字识别处理服务器,上述的三种服务器组成局域网。本发明的有益效果为:通过减少对重复文字图像的处理次数就能够极大的加快整个系统的图像文字识别匹配速度,系统中图像的文字识别匹配的结果保存在了处理结果缓存结构中,在对文字图像进行是否为垃圾彩信的判断时,不是直接采用图像文字识别匹配相关算法,而是先在处理结果缓存结构中查找该图像是否被处理过,在处理结果缓存结构中查找处理结果,要比对图像进行文字识别匹配速度快很多。 | ||
搜索关键词: | 文字识别 图像文字识别 匹配 缓存结构 缓存加速系统 实时图像 文字图像 配置管理服务器 图像 处理服务器 缓存服务器 查找 比对图像 结果保存 垃圾彩信 算法 局域网 服务器 重复 | ||
【主权项】:
1.一种实时图像文字识别缓存加速系统,包括配置管理服务器(110)、处理结果缓存服务器(120)和若干个图像文字识别处理服务器(130),上述的三种服务器组成局域网,如下:(1)配置管理服务器(110),用于向图像文字识别服务器(130)和处理结果缓存服务器(120)发送垃圾彩信文字图像配置,配置内容包括垃圾文字图像MD5特征和文字特征。(2)处理结果缓存服务器(120),分别接收来自配置管理服务器(110)的垃圾彩信文字图像配置和来自图像文字识别服务器(130)的相关图像垃圾识别处理结果信息,处理结果缓存服务器(120)依据图像的垃圾识别处理结果和相关图像MD5值,构造一个以图像MD5为键,以垃圾识别结果、命中次数和最近命中时间为键值的处理结果快速查询缓存结构。(3)图像文字识别处理服务器(130),接收来自配置管理服务器(110)的垃圾文字图像配置,接收来自处理结果缓存服务器(120)的彩信图像数据,并依据垃圾图像MD5特征和文字特征对其进行文字图像识别匹配处理,并将处理结果发送给处理结果缓存服务器(120)。所述配置管理服务器(110)包括配置管理单元(210)和配置推送单元(220),如下:(1)配置管理单元(210),用于完成配置的管理,包括新增、修改、删除操作。(2)配置推送单元(220),用于将更新后的配置信息向局域网中的处理结果缓存服务器(120)和图像文字识别服务器(130)进行配置推送。所述处理结果缓存服务器(120)包括配置接收单元(310)、配置更新单元(320)、处理结果查找单元(330)、结果缓存区清理单元(340)、处理结果接收单元(350)和图像数据发送单元(360),如下:(1)配置接收单元(310),用于接收来自配置管理服务器(110)发送来的垃圾彩信文字图像配置信息。(2)配置更新单元(320),用于在接收到需要修改的垃圾彩信文字图像配置信息后,在本机的处理结果快速查询缓存结构中查找相关对应配置信息,并对该结果对应的配置信息进行修改。(3)处理结果查找单元(330),用于计算图像的MD5值,并依据该MD5值在本机的处理结果快速查询缓存结构中查找该图像上次处理的结果信息。(4)结果缓存区清理单元(340),用于定时使用LRU算法对结果缓存区进行清理。(5)处理结果接收单元(350),用于接收来自图像文字识别服务器(130)的图像处理结果数据,并以图像MD5为键、以图像处理结果为键值,将该图像的处理结果写入本机的处理结果快速查询缓存结构中。(6)图像数据发送单元(360),对于第一次出现的图像数据,在处理结果快速查询缓存结构中找不到相应的图像处理结果时,该单元负责将该图像数据发送给图像文字识别服务器(130)。所述图像文字识别处理服务器(130)包括配置接收单元(410)、配置更新单元(420)、文字图像判断单元(430)、OCR识别单元(440)、垃圾文字特征匹配单元(450)、垃圾文字特征匹配单元(460)和图像数据接收单元(470),如下:(1)配置接收单元(410),用于接收来自配置管理服务器(110)发送来的垃圾彩信文字图像配置信息。(2)配置更新单元(420),用于在接收到需要修改的垃圾彩信文字图像配置信息后,在本机的垃圾彩信文字图像特征结构中查找相关对应的配置信息,并对该图像特征对应的配置信息进行修改。(3)文字图像判断单元(430),用于根据图像的前景色、背景色和轮廓等特征对文字图像进行判断。(4)OCR识别单元(440),用于对文字图像进行OCR处理。(5)垃圾文字特征匹配单元(450),用于对OCR识别的文字结果依据垃圾彩信文字图像特征进行匹配处理,判断文字图像是否为垃圾彩信。(6)垃圾文字特征匹配单元(460),用于将图像处理结果信息发送给处理结果缓存服务器(110)。(7)图像数据接收单元(470),用于接收来自处理结果缓存服务器(110)的彩信图像数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810436632.0/,转载请声明来源钻瓜专利网。