[发明专利]互联网金融网站的异常检测方法及装置在审
申请号: | 201911090024.X | 申请日: | 2019-11-08 |
公开(公告)号: | CN110930165A | 公开(公告)日: | 2020-03-27 |
发明(设计)人: | 王锟;吴震;唐积强;陈梓萱;施力;邢凯;胡晓光;刘刚;周洋 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;深圳市任子行科技开发有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06Q40/06;G06F40/289 |
代理公司: | 深圳市顺天达专利商标代理有限公司 44217 | 代理人: | 郭伟刚 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 互联网 金融 网站 异常 检测 方法 装置 | ||
本发明公开了一种互联网金融网站的异常检测方法及装置,该方法包括:获取互联网金融网站的文本信息;当所述文本信息中存在收益率关键词时,从所述文本信息中提取所述收益率关键词对应的收益率数值;根据所述收益率关键词以及所述收益率关键词对应的收益率数值,确定最大收益率;当所述最大收益率大于预设收益率时,确定所述互联网金融网站存在异常。通过本发明,从互联网金融网站中提取该网站公示的收益率,当提取的收益率过高时,说明该互联网金融网站存在高风险或诈骗特征,因此,认定该网站存在异常,从而认定该网站所属公司处于经营异常状态,实现了对互联网金融公司实行有效监管。
技术领域
本发明涉及数据处理技术领域,尤其涉及互联网金融网站的异常检测方法及装置。
背景技术
互联网金融在2007年首次进入国内,并在2013年和2014年进入蓬勃发展的阶段,但同时也出现了大量的问题平台,诸如跑路、停业、庞氏骗局等等。2015年7月,央行颁发了互联网金融的监管文件《关于促进互联网金融健康发展的指导意见》,标志国家层面的监管正式启动。然而,借助于“互联网+”,导致有关部门难以对互联网金融公司实行有效监管,导致出现了大量的p2p网贷等互金平台运行不久即出现倒闭跑路、提现困难的情况,给社会带来巨大财富损失的同时,也极易引发社会稳定问题。
发明内容
本发明的主要目的在于解决现有技术中难以对互联网金融公司实行有效监管的技术问题。
为实现上述目的,本发明提供一种互联网金融网站的异常检测方法,所述方法包括:
获取互联网金融网站的文本信息;
当所述文本信息中存在收益率关键词时,从所述文本信息中提取所述收益率关键词对应的收益率数值;
根据所述收益率关键词以及所述收益率关键词对应的收益率数值,确定最大收益率;
当所述最大收益率大于预设收益率时,确定所述互联网金融网站存在异常。
可选的,所述获取互联网金融网站的文本信息,包括:
基于selenium webdriver技术驱动phantomjs浏览器引擎,以供开启所述phantomjs浏览器;
将互联网金融网站的网站输入所述phantomjs浏览器,以供开启所述互联网金融网站;
获取所述互联网金融网站的源代码,以所述源代码作为所述互联网金融网站的文本信息。
可选的,所述当所述文本信息中存在收益率关键词时,从所述文本信息中提取所述收益率关键词对应的收益率数值,包括:
当所述文本信息中存在收益率关键词时,对所述文本信息进行字符删除以及字符替换处理;
基于特定分割字符将经过字符删除以及字符替换处理后的文本信息划分成多个子文本信息;
从所述多个子文本信息中确定存在所述收益率关键词的目标子文本信息;
从所述目标子文本信息中提取与所述收益率关键词相距最近且距离小于预设字距的数值作为所述收益率关键词对应的收益率数值。
可选的,所述从所述目标子文本信息中提取与所述收益率关键词相距最近且距离小于预设字距的数值作为所述收益率关键词对应的收益率数值,包括:
从所述目标子文本信息中提取与所述收益率关键词相距最近且距离小于预设字距的数值;
当所述数值在所述收益率关键词的左侧时,检测在所述数值左侧相邻的字符是否为运算符号;
若在所述数值左侧相邻的字符不为运算符号,则以所述数值作为所述收益率关键词对应的收益率数值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;深圳市任子行科技开发有限公司,未经国家计算机网络与信息安全管理中心;深圳市任子行科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911090024.X/2.html,转载请声明来源钻瓜专利网。