[发明专利]识别图片的方法和装置有效
申请号: | 201710537368.5 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107330470B | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 强晶晶 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;姜劲 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图片 方法 装置 | ||
本发明公开了一种识别图片的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:接收待识别图片;把所述图片切割成一个或多个子图片;把所述子图片输入分类器,由所述分类器基于预先训练获得的第一模型为所述子图片标记标签,从而识别所述图片。该实施方式能够提高模糊图片的识别效率和识别准确率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种识别图片的方法和装置。
背景技术
图片验证码是程序用于拦截无效请求的有效手段之一,其作为一种辅助安全的手段常用于web系统中。图片验证码识别技术对于安全监测有很大的帮助,测试工程师通过对web系统的图片验证码进行自动识别,可以绕过验证码限制,从而对web系统进行高并发环境下的自动化压力测试。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有的图片验证码的自动识别方法中,对于图片的解析是通过传统的对图片点、线的分析和灰度、色彩的分析,采用该种解析方法对图片验证码文字进行抽取、去噪和识别,对于模糊程度较高的图片验证码,识别效率和识别准确率都较低。
因此,亟需一种能够提高模糊图片的识别效率和识别准确率的识别图片的方法和装置。
发明内容
有鉴于此,本发明实施例提供一种识别图片的方法和装置,能够提高模糊图片的识别效率和识别准确率。
为实现上述目的,根据本发明实施例的一个方面,提供了一种识别图片的方法,包括:
接收待识别图片;
把所述图片切割成一个或多个子图片;
把所述子图片输入分类器,由所述分类器基于预先训练获得的第一模型为所述子图片标记标签,从而识别所述图片。
进一步的,把所述图片切割成一个或多个子图片包括对所述子图片进行二值化和去噪处理。
进一步的,所述第一模型通过下述模型训练步骤获得:
获取图片集;
对所述图片集中的每个图片进行切割以得到该图片的子图片集;
在所有子图片集中选取子图片组成第一子图片集,为所述第一子图片集中的每个子图片标记标签;
在所有子图片集中选取子图片组成第二子图片集,将所述第二子图片集中的子图片的像素与所述第一子图片集中的每个子图片的像素进行对比,根据对比得到的像素有效率为第二子图片集中的每个子图片标记标签;
把所述第二子图片集中的每个子图片输入分类器,所述分类器基于所述第二子图片集进行训练获得第二模型;
把所有子图片集中的每个子图片输入分类器,所述分类器基于所述第二模型为该每个子图片标记标签;
把所有子图片集中的每个子图片输入分类器,所述分类器基于该所有子图片集训练获得所述第一模型。
本发明实施例提供的识别图片的方法还包括:
若图片识别错误,则保存该图片,以将该图片加入所述图片集中,并通过执行所述模型训练步骤获得新的第一模型。
进一步的,对图片进行切割包括:
对该图片从左至右逐列扫描,当找到第一个有效像素,则取该像素的横坐标作为第一个子图片的左界,然后继续逐列扫描,当找到第一个全无效的像素列,则取该列的横坐标作为所述第一个子图片的右界,
在所述第一个子图片的左界和右界之间从上到下逐行扫描,当找到第一个有效像素,则取该像素的纵坐标作为第一个子图片的上界,然后继续逐行扫描,当找到第一个全无效的像素行,则取该行的纵坐标作为所述第一个子图片的下界,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710537368.5/2.html,转载请声明来源钻瓜专利网。