[发明专利]一种网站安全监测方法及装置有效
申请号: | 201710812031.0 | 申请日: | 2017-09-11 |
公开(公告)号: | CN107547555B | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 张乐平;张博;李海峰;侯磊 | 申请(专利权)人: | 北京匠数科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 何少岩 |
地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网站 安全 监测 方法 装置 | ||
1.一种网站安全监测方法,其特征在于,所述方法包括:
从目标网站的各个网址所对应的网页中提取网页内容信息,所述网页内容信息包括:视频信息、图片信息或文本信息中至少一种;
分别确定各个所述网页中的所述网页内容信息中是否存在不良信息;
当任一所述网页中的所述网页内容信息中存在不良信息时,确定所述目标网站为异常网站;
向所述异常网站对应的管理终端发送提示信息,以使所述管理终端对应的管理人员对所述异常网站进行维护;和/或,关闭所述异常网站的访问通道或者删除存在不良信息的异常网页,以阻止用户终端继续访问所述异常网站或者所述异常网页;
当所述网页内容信息包括图片信息时,所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息,包括:
对待识别的所述图片信息进行敏感图像区域提取处理,得到所述图片信息中的多个敏感图像区域;
利用不良信息识别模型计算各个所述敏感图像区域的不良信息匹配度,根据各个所述不良信息匹配度计算所述图片信息的不良信息存在概率;其中,所述不良信息识别模型是通过如下方式构建:利用深度学习方法对选取的不良信息样本进行深度神经网络训练,得到不良信息识别模型,所述不良信息识别模型为多隐层的机器学习模型,通过收集海量的包含不良信息的图像、视频作为所述不良信息样本,使用所述不良信息样本对所述不良信息识别模型进行训练优化特征参数,以在深度学习的过程中不断提高识别精度;
当所述不良信息存在概率大于第一预设阈值时,确定所述图片信息中存在不良信息;
当所述网页内容信息包括文本信息时,所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息,包括:
对待识别的所述文本信息进行分句处理,得到多个独立的语句;
对多个独立的所述语句进行关键词分割处理,分析各所述语句中的多个关键词之间的依存关系;
根据所述依存关系,对各所述关键词或多个所述关键词的组合进行负面情感算法识别,判断各所述语句是否具有负面情感;
基于预先构建的敏感词汇库,对各所述关键词进行敏感词汇识别,判断各所述语句是否包含敏感词汇;
如果任一所述语句具有负面情感且包含敏感词汇,则计算所述文本信息的不良信息存在概率;
当所述不良信息存在概率大于第三预设阈值时,确定所述文本信息中存在不良信息;
当所述网页内容信息包括视频信息时,所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息,包括:
对待识别的所述视频信息进行分帧处理,得到多个视频帧;
逐一对各个所述视频帧进行敏感区域提取处理,得到所述视频帧中的多个敏感区域;
利用不良信息识别模型计算各个所述敏感区域的不良信息匹配度,根据各个所述不良信息匹配度计算所述视频帧的不良信息存在概率;
当所述不良信息存在概率大于第二预设阈值时,确定所述视频帧中存在不良信息;
当任一所述视频帧中存在不良信息时,确定所述视频信息中存在不良信息;
当任一所述视频帧中存在不良信息时,确定所述视频信息中存在不良信息,具体包括:当首次识别到视频帧为包含不良信息的视频帧时,将不良视频帧出现次数加1;
判断当前累计的所述不良视频帧出现次数是否大于不良次数阈值;
若是,则确定所述视频信息中存在不良信息;
当所述网页内容信息包括视频信息、图片信息或文本信息三项类型信息中至少两项时,所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息,包括:
分别计算各类型信息中每种类型的不良信息对应的不良信息存在概率,所述不良信息包括以下中的至少一种:色情、反动、暴力;
判断各类型信息中每种类型的不良信息对应的所述不良信息存在概率是否大于所述类型信息中某一类型的不良信息对应的预设阈值;
如果任一所述不良信息存在概率大于对应的预设阈值,则确定所述网页内容信息中存在不良信息;
如果所有所述不良信息存在概率均不大于对应的预设阈值,则根据各类型信息中每种类型的不良信息对应的所述不良信息存在概率计算各种类型的不良信息对应的综合不良信息存在概率;
判断各所述综合不良信息存在概率是否大于相应类型的不良信息对应的综合预设阈值;
如果任一所述综合不良信息存在概率大于对应的综合预设阈值,则确定所述网页内容信息中存在不良信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京匠数科技有限公司,未经北京匠数科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710812031.0/1.html,转载请声明来源钻瓜专利网。