[发明专利]一种基于语义的点选验证码识别方法及其装置在审
申请号: | 201811076100.7 | 申请日: | 2018-09-14 |
公开(公告)号: | CN109033798A | 公开(公告)日: | 2018-12-18 |
发明(设计)人: | 黄文瀚;程浩;柳超 | 申请(专利权)人: | 北京金堤科技有限公司 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06F17/27;G06K9/62;G06N3/08 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 王文红 |
地址: | 100000 北京市海淀区知春*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 验证码 点选 语义 验证码图片 短文本 神经网络模型 测试工程师 测试和评价 定位信息 概率矩阵 文本语义 验证方式 字符识别 字符数 准确率 构建 网站 测试 学习 | ||
本发明提供了一种基于语义的点选验证码识别方法及其装置,其中所述方法包括:在验证码图片中,获取待选字符的字符数及字符截图;构建字符识别神经网络模型,并得到识别概率矩阵;确定所述字符截图对应的短文本;根据短文本,选取相应的待选字符,得到验证码图片中待选字符对应的定位信息。本发明实现了通过深度学习技术,对基于语义的点选验证码进行识别,为测试人员提供一种评价基于语义的点选验证码的有效性的方法,通过本发明所提供的识别方法,可实现简单高效的推测文本语义,极大的提高了对验证码识别的准确率,且方便实用,为测试工程师的对于网站点选验证方式安全性的测试和评价带来极大的方便。
技术领域
本发明涉及验证码测试技术领域,更具体地说,涉及一种基于语义的点选验证码识别方法及其装置。
背景技术
验证码(CAPTCHA)常见于web登录界面中。优良设计的验证码可以被人工识别,但是很难被自动工具识别,从而达到保护网站不被恶意使用的目的。相比于传统的输入型验证码,点选验证码具有安全性高、对用户友好等优点,逐渐替代传统验证码,成为主流方式。
目前点选验证码中,有一种是基于语义的点选验证码,的其工作原理如下:服务端持有一个丰富的短文本语料库,通常单条文本的长度n取3-6字。服务端随机从语料中选择一条文本,利用图形库生成汉字图像,并在图像中加入干扰。然后在一张大的背景图片中随机生成n个位置(短文本中汉字的数量),将n个汉字与背景图片做融合。服务端按照文本的语序将n个汉字的位置存储在session中,用以记录正确答案。最后将生成的图片下发到网页端,并要求在用户按照语序点击图片中的文字。用户点击汉字后,汉字对应的位置信息会传到服务器进行校验,如过果偏差在阈值规定的范围内,则校验通过,否则不通过。
为了能有效的拦截恶意的访问,很多网站都部署的验证码技术。而在网站上线运行前,测试工程师会对网站的验证码进行识别,以检测网站的安全性。如被自动化软件识别的概率高,则表明网站的验证码机制不安全。现有的验证码识别技术主要是针对输入型验证码,以及普通点选型验证码,而对于基于语序/语义的点选型验证码尚未提供解决思路,导致基于语序/语义的点选验证技术的网站或客户端无法进行验证码的测试,存在巨大的安全隐患,给测试工程师对于网站或客户端的点选验证码安全性的测试带来极大的不便。
发明内容
有鉴于此,本发明提供一种基于语义的点选验证码识别方法及其装置以解决现有技术的不足。
为解决上述问题,本发明提供1.一种基于语义的点选验证码识别方法,包括:
在验证码图片中,获取所述验证码图片中所包含的待选字符的字符数及字符截图;
构建字符识别神经网络模型,并通过所述字符识别神经网络模型对所述字符截图进行识别,得到识别概率矩阵;
根据所述字符数和所述识别概率矩阵,确定所述字符截图对应的短文本;
根据所述短文本,从所述识别概率矩阵中选取相应的待选字符,得到所述验证码图片中每个所述待选字符对应的定位信息。
优选地,所述“根据所述字符数和所述识别概率矩阵,确定所述字符截图对应的短文本”包括:
构建短文本语料集;所述短文本语料集中包含有多个不同预设字符数量的短文本对应的文本语料库;
选择与所述字符数对应的文本语料库;
根据所述识别概率矩阵,计算所述文本语料库中的所有文本的非规范化概率,得到概率信息集;
提取所述概率信息集中非规范化概率最大的文本作为所述短文本。
优选地,所述“根据所述识别概率矩阵,计算所述文本语料库中的所有文本的非规范化概率,得到概率信息集”包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811076100.7/2.html,转载请声明来源钻瓜专利网。