[发明专利]一种人机识别方法及系统有效
申请号: | 201310068736.8 | 申请日: | 2013-03-05 |
公开(公告)号: | CN104036780B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 付颖芳;张玉东 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/22;H04L29/06 |
代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 栗若木 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机 识别 方法 系统 | ||
技术领域
本发明涉及计算机领域,尤其涉及一种人机识别方法及系统。
背景技术
随着互联网的普及,各种网络服务日益成为人们日常生活的一部分,如电子商务、免费的电子邮箱服务、免费的资源下载等等。然而,这些面向人类用户的服务时常被非法用户攻击和一些恶意计算机程序滥用,它们占用服务资源,产生大量的网络垃圾,影响用户的网络体验,对网络服务的安全性造成极大威胁。
人机识别系统是一种全自动开放式人机区分图灵机测试(Completely Automated Public Turing test to tell computers and humans apart,CAPTCHA),利用进行问答式身份验证的安全措施来区分计算机与人为目标的系统。CAPTCHA的运行机制如下:一个专门的服务器负责产生和评估CAPTCHA测试,用户使用某个需验证的网络服务时,服务器提供给用户一个测试,用户做完后将测试结果提交给服务器,服务器根据结果进行评估,决定该用户能否通过测试。
目前CAPTCHA技术主要采用的技术有文本CAPTCHA、图像CAPTCHA、声音CAPTCHA技术,3类CAPTCHA技术基于AI领域的不同问题,具有不同的特性:
文本CAPTCHA利用人和机器在字符识别方面的差异,利用验证码技术来区别人和机器。所谓验证码,就是将一串随机产生的数字或符号,生成一幅扭曲字符串的图片,图片里加上一些干扰像素(防止光学字符识别),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。如CSDN(Chinese software develop net,中国软件开发联盟)网站用户登录用的是GIF格式+数字方式;QQ网站注册采用随机生成的汉字,登录采用PNG格式,图片用的随机数字+随机大写英文字母;MSN的hotmail申请时用的BMP格式,随机数字+随机大写英文字母+随机干扰像素+随机位;google的gmail注册的时候采用JPG格式,随机数字+随机颜色+随机位置+随机长度;某些大型论坛采用XBM格式,内容随机。
图像CAPTCHA利用人和机器在图像分类、目标识别、常见理解等方面的差异,通常独立于不同语言,无需用户文本输入、更难破解。如CMU设计的CAPTCHA BONGO,利用两组视觉模型(如线、圆、方块等),让用户判断新模式的类别,然而2选1的设计无法保证其安全性;再比如带标注的图像数据库,此类CAPTCHA的致命弱点是一旦用户拥有了这个数据库,算法不攻自破。google推出一种基于图像方向识别的CAPTCHA What’s up,一幅图像旋转到它的垂直方向。What’s up无需图像标注,通过在测试中加入候选图,利用用户反馈结果修正初始标注。此外,What’s up训练了一个自动图像方向检测器过滤掉能被机器识别的图像,根据反馈机制过滤掉不易被人类用户识别的图像,确保测试能被大多数人类用户通过而机器不能通过。与基于图像分类的CAPTCHA相比,What’s up利用更难的图像理解问题,需要用户对图像中的内容进行分析;可用图像的数量庞大,不受限于具体的物品图像;根据用户反馈自动标注图像,少了繁琐的人工参与。
声音CAPTCHA利用人和机器在语音识别上的差异,以随机间隔播放随机选择的一个或多个人播报的数字、字母或单词,并添加背景噪声以抵抗ASR(Automatic Speech Recognition,自动语音识别技术)的攻击,在声音CAPTCHA BYAN-Ⅰ和BYAN-Ⅱ中,用户被提示选择惯用语言,计算机据此随机选择6个数字生成测试音频,音频中添加另一个讲话者的声音作为背景噪声,用户需正确输入测试音频中的6个数字。其中,BYAN-Ⅰ的背景噪声是相同的6个数字,BYAN-Ⅱ的背景噪声是随机选取的词汇。
目前,主流CAPTCHA技术虽然某种程度避免了恶意计算机程序滥用网络服务,但易遭受各种攻击而被破解,用户的体验性也很差。具体分析如下:
文本CAPTCHA通过扭曲文字或字符来识别人和机器,在某种程度上防止了计算机程序的恶意注册或登录,但是随着字符分割和光学字符识别(Optical Character Recognition,OCR)技术的发展,大多数文本CAPTCHA已被成功破解,简单的字符识别问题已不能阻止计算机程序,况且扭曲的文字让人也难以识别,使得用户体验很不好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310068736.8/2.html,转载请声明来源钻瓜专利网。