[发明专利]欺诈网页检测方法、计算机设备和计算机可读存储介质有效
申请号: | 201710316847.4 | 申请日: | 2017-05-08 |
公开(公告)号: | CN107135220B | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 李苗苗 | 申请(专利权)人: | 北京儒博科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/26 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 101500 北京市密云县经济开发*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 网页 检测 方法 计算机 设备 可读 存储 介质 | ||
本发明实施例公开了一种欺诈网页检测方法、计算机设备和计算机可读存储介质,其中该方法包括:获取当前网页的账号信息;根据所述账号信息与预设黑名单对当前网页进行欺诈检测,得到第一检测结果;根据预设特征信息对当前网页进行欺诈检测,得到第二检测结果;如果第一检测结果与第二检测结果均是疑似欺诈网页,则确定当前网页是欺诈网页。本发明实施例与欺诈类型或欺诈方法无关,无需搜集新的欺诈类型或欺诈方法的语料,避免了欺诈类型或欺诈方法被淘汰导致的召回率低的问题;预设黑名单和预设特征信息均无需大量人力成本维护,人工干预少,节省人力成本;另外,结合两种欺诈检测方式的检测结果进行欺诈网页的确定,检测准确率高。
技术领域
本发明实施例涉及互联网技术领域,尤其涉及一种欺诈网页检测方法、计算机设备和计算机可读存储介质。
背景技术
目前,检测网页是否为欺诈网页,一般有如下两种方法:
(1)使用机器学习的方法,将各种渠道收集到的欺诈网页,根据其欺诈领域进行分类,同时收集合法网页作为非欺诈网页类,然后通过训练得到分类器。在检测时分类器将网页直接进行分类,判断该网页是否为欺诈网页以及其欺诈类型。但是,这种方法受限于语料,新的欺诈类型或方法需要较长时间才能收集到丰富语料,而由于对抗等原因,原有的欺诈方法可能很快就被淘汰,召回率低。
(2)使用在网页中找各种关键特征词、特征句的方法,这种方法虽然能够在发现新型的欺诈方式时快速开发,但是维护这些特征词、特征句需要大量的人力投入,而且该方法检测准确率较低。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供一种欺诈网页检测方法、计算机设备和计算机可读存储介质,与欺诈类型或欺诈方法无关,无需搜集新的欺诈类型或欺诈方法的语料,也无需大量人力成本维护,同时欺诈检测的准确率高。
第一方面,本发明实施例提供了一种欺诈网页检测方法,包括:
获取当前网页的账号信息;
根据所述账号信息与预设黑名单对所述当前网页进行欺诈检测,得到第一检测结果;
根据预设特征信息对所述当前网页进行欺诈检测,得到第二检测结果;
如果所述第一检测结果与所述第二检测结果均是疑似欺诈网页,则确定所述当前网页是欺诈网页。
第二方面,本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任意实施例所述的欺诈网页检测方法。
第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所述的欺诈网页检测方法。
本实施例的欺诈网页检测方法、计算机设备和计算机可读存储介质,与欺诈类型或欺诈方法无关,不受限于语料,无需搜集新的欺诈类型或欺诈方法的语料,避免了欺诈类型或欺诈方法被淘汰导致的召回率低的问题;预设黑名单和预设特征信息均无需大量人力成本维护,人工干预少,节省人力成本;另外,结合两种欺诈检测方式的检测结果进行欺诈网页的确定,检测准确率高。
附图说明
图1是本发明实施例一提供的欺诈网页检测方法的流程图;
图2是本发明实施例二提供的建立黑名单的流程示意图一;
图3是本发明实施例二提供的建立黑名单的流程示意图二;
图4是本发明实施例三提供的欺诈网页检测装置的结构框图;
图5是本发明实施例四提供的计算机设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京儒博科技有限公司,未经北京儒博科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710316847.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物联网信息安全传输方法
- 下一篇:一种渐进式求解K最大概率攻击路径的方法