[发明专利]一种网页信息识别方法、装置及系统有效
申请号: | 201310254215.1 | 申请日: | 2013-06-24 |
公开(公告)号: | CN103425736A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 王佳斌;罗谷才 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 唐华明 |
地址: | 518031 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 信息 识别 方法 装置 系统 | ||
技术领域
本发明涉及计算机应用技术领域,特别是涉及一种网页信息识别方法、装置及系统。
背景技术
随着计算机技术的快速发展,网络通信形式越来越多,比如:多种类型的聊天工具、游戏、邮箱、银行业务交易工具、第三方购物支付平台等多种具有私密性的网络应用,这些网络应用都具有各自的登录界面,当用户使用这些网络应用时,首先必须在应用的登录网页上填写相关登录信息,才能够进入应用中。
例如:当用户想要使用聊天工具时,在第一次使用时需要注册账户,并记住账户信息包括:账户号和密码;当用户再次需要使用时,只需要正确填写相关信息即可。由于可以通过获取用户账户信息进而获取用户的私密信息,如果是聊天工具就可能获取用户的隐私,如果是银行业务交易工具就有可能通过获取的信息进而给用户造成一定的经济损失,如果是邮箱就可能窃取用户的私密邮件等。因此,目前网络中出现了多种多样的账号欺诈网站,专门获取用户的相关账户信息,以盗取用户的私密资讯给用户造成了不同程度的损失。同时,也降低了各种网络应用的用户体验,影响了用户对网络应用的信任度和关注度。
目前,用以识别网站是否是账号欺诈网页的方法,具体是:检测用户访问的网页的URL是否属于白名单中的URL,当不属于白名单的URL时,将当前访问的URL发送至URL鉴别服务器,服务器根据URL下载该网页,检测网页的特征内容包括:检测是否存在“XX登录”、“密码”“登录”等关键字,检测是否存在特定的账号和密码输入框,如果存在上述检测信息,判断该网页所属网站是否属于正规的合法注册网站。由此判断所访问的网页是否是账号欺诈网页。
但是,现在大量账号欺诈网站都采用将“XX登录”、“密码”等关键字修改成图像的形式,或者修改成FLASH的形式,经过这样处理后,现有的账号欺诈网页识别方法,无法实现正确识别。
基于上述技术存在的技术问题,现在迫切需要提供一种网页信息识别方法,以正确识别账号欺诈网页,提高网络应用的用户体验,保证网络应用的可靠性。
发明内容
本发明实施例的主要目的是提供一种网页信息识别方法、装置及系统,以解决现有技术中存在的无法识别网页是否是账号欺诈网页的技术问题。
为了解决上述技术问题,本发明实施例提供的技术方案如下:
一种网页信息识别方法,包括:
获取用户当前访问的网页;
在所述网页中提取图像的识别信息;
对比所述提取图像的识别信息与数据库中储存的图像信息,计算相似度;
当所述相似度落在预设的数值区间内,确定该网页为账号登录页面;
当确定该网页为账号登录页面时,检测所述网页的URL对应的网站是否为合法网站,如果不是,确定所述用户当前访问的网页为账号欺诈网页。
优选的,所述对比所述提取图像的识别信息与数据库中储存的图像信息,计算相似度,包括:
采用图像识别和图像信息元素相似度匹配的方法,将所述提取图像的识别信息中的每一项信息元素与数据库中储存的图像信息中每一项信息元素进行对比,计算每一项对比评分;
根据所述每一项对比评分计算总对比评分,作为相似度。
优选的,检测所述网页的URL对应的网站是否有认证资质,包括:
根据所述网页的URL查找所述网页对应的网站信息;
检测所述网站信息中是否包含登录界面的认证资质。
优选的,所述数据库中储存的图像信息是通过以下方式进行储存,包括:
定期打开每一个正规登录网站的账户登录界面,提取所述账户登录界面的图像信息;
将所述图像信息储存在数据库中的图像库中。
优选的,还包括:
当检测出所述用户当前访问的网页为账号欺诈网页时,反馈警告信息给用户。
优选的,还包括:
将识别出的账号欺诈网页储存起来,以便下一次直接识别出该账号欺诈网页。
优选的,所述图像的识别信息包括:
账号输入框信息、密码输入框信息、登录按钮信息和关键字信息中任意一种或者任意多种;
所述账号输入框信息包括:关键字是账号、输入框的大小和输入框的位置;所述密码输入框信息包括:关键字是密码、输入框的大小和输入框的位置;所述登录按钮信息包括:关键字是登录、输入框的大小和输入框的位置。
本发明还提供了一种网页信息识别装置,包括:
获取模块,用于获取用户当前访问的网页;
提取模块,用于在所述网页中提取图像的识别信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310254215.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大型平面连续在线式热转印机
- 下一篇:一种用于生产玻璃盖板的新型网版
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置