[发明专利]一种互联网风险监控方法和系统在审
申请号: | 202210447217.1 | 申请日: | 2022-04-26 |
公开(公告)号: | CN115033819A | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 丁宁;陈思佳;姚琴 | 申请(专利权)人: | 广东希尔文化传媒投资股份有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958;G06F16/955;G06V10/74;G06F40/205 |
代理公司: | 北京高航知识产权代理有限公司 11530 | 代理人: | 乔浩刚 |
地址: | 519006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 风险 监控 方法 系统 | ||
本发明提供一种互联网风险监控方法和系统,其中该方法包括:S1发起模拟搜索,搜索目标广告投放网址;S2获取搜索引擎的搜索结果列表,获取搜索结果列表中的链接信息;S3使用获取的链接信息并获取进一步的跳转链接,直到获取最终跳转链接;S4获取最终跳转链接的网站截图、网站代码和网站文本内容中的至少一项;S5根据获取的网站截图、网站代码和网站文本内容中的至少一项,基于人工智能技术采用预设的审核策略进行审核,得到网站风险审核结果。本发明有助于提高广告投放网站监管的可靠性和智能化水平。
技术领域
本发明涉及互联网技术领域,特别是一种互联网风险监控方法和系统。
背景技术
目前,线上广告的代理商都需要对其运营的线上广告网站或页面做风险控制,第一是防止被网络攻击导致网站出现非法信息,第二防止网站提供者自身有意的篡改网站导致出现违法信息。
现有的技术只能针对网站或网页的直接监控,没有办法处理网站在判断时间、来自哪个搜索引擎、地域的情况下的跳转,监测力度不够,无法有效的防止非法信息的出现。
例如某网站的搜索付费广告是推广abc.com,搜索关键字是模具加工,该网站内容大部分时间合法合规,但是当在夜晚通过搜索关键字模具加工时,点击该推广链接却进入的是另外一个线上博彩的网站。因为该网站做了代码跳转,当该网站判断出是夜里和来自某搜索引擎时,就会跳转到另外一个网站。
发明内容
针对上述对于线上广告网站或者网页监测力度不够,无法有效的防止非法信息的出现的问题,本发明旨在提供一种互联网风险监控方法和系统。
本发明的目的采用以下技术方案来实现:
第一方面,本发明提出一种互联网风险监控方法,该方法包括:
S1发起模拟搜索,搜索目标广告投放网址;
S2获取搜索引擎的搜索结果列表,获取搜索结果列表中的链接信息;
S3使用获取的链接信息并获取进一步的跳转链接,直到获取最终跳转链接;
S4获取最终跳转链接的网站截图、网站代码和网站文本内容中的至少一项;
S5根据获取的网站截图、网站代码和网站文本内容中的至少一项,基于人工智能技术采用预设的审核策略进行审核,得到网站风险审核结果。
一种实施方式中,步骤S1包括:根据预设的目标广告投放网址信息和预设的巡检频率信息发起模拟检索,在搜索引擎中搜索目标广告投放网址。
一种实施方式中,步骤S2中,当获取的搜索结果列表中不包含直接链接,则通过文本匹配获取搜索引擎的跳转链接作为搜索结果中列表中的链接信息。
一种实施方式中,步骤S3中,使用获取的链接信息访问网站,如果该网站没有发生跳转,则将该网站的链接作为最终跳转链接;如果发生跳转,则进一步访问跳转链接,直到获取最终跳转链接。
一种实施方式中,步骤S5中,根据获取的网站截图、网站代码和网站文本内容进行审核,包括:图像审核、文本审核和关键字审核;其中
图像审核包括利用图像相似算法,将该网站当前截图和登记时的截图进行对比,如果相似度相差高于阈值,则输出图像审核结果不通过;
文本审核包括通过对比网站当前文本和登记时的文本进行对比,如果相似度相差高于阈值,则输出文本审核结果不通过;
关键字审核包括通过自定义的关键字库的碰撞对比,如果出现的违规关键词数量高于阈值,则输出关键字审核结果不通过。
一种实施方式中,步骤S5还包括:
当图像审核、文本审核和关键字审核中的其中一项审核结果不通过,则输出网站风险审核结果不通过,并发出警告通知。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东希尔文化传媒投资股份有限公司,未经广东希尔文化传媒投资股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210447217.1/2.html,转载请声明来源钻瓜专利网。