[发明专利]一种网站安全监测方法及装置有效

申请号：	201710812031.0	申请日：	2017-09-11
公开（公告）号：	CN107547555B	公开（公告）日：	2021-04-16
发明（设计）人：	张乐平;张博;李海峰;侯磊	申请（专利权）人：	北京匠数科技有限公司
主分类号：	H04L29/06	分类号：	H04L29/06
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	何少岩
地址：	100089 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种网站安全监测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种网站安全监测方法，其特征在于，所述方法包括：

从目标网站的各个网址所对应的网页中提取网页内容信息，所述网页内容信息包括：视频信息、图片信息或文本信息中至少一种；

分别确定各个所述网页中的所述网页内容信息中是否存在不良信息；

当任一所述网页中的所述网页内容信息中存在不良信息时，确定所述目标网站为异常网站；

向所述异常网站对应的管理终端发送提示信息，以使所述管理终端对应的管理人员对所述异常网站进行维护；和/或，关闭所述异常网站的访问通道或者删除存在不良信息的异常网页，以阻止用户终端继续访问所述异常网站或者所述异常网页；

当所述网页内容信息包括图片信息时，所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息，包括：

对待识别的所述图片信息进行敏感图像区域提取处理，得到所述图片信息中的多个敏感图像区域；

利用不良信息识别模型计算各个所述敏感图像区域的不良信息匹配度，根据各个所述不良信息匹配度计算所述图片信息的不良信息存在概率；其中，所述不良信息识别模型是通过如下方式构建：利用深度学习方法对选取的不良信息样本进行深度神经网络训练，得到不良信息识别模型，所述不良信息识别模型为多隐层的机器学习模型，通过收集海量的包含不良信息的图像、视频作为所述不良信息样本，使用所述不良信息样本对所述不良信息识别模型进行训练优化特征参数，以在深度学习的过程中不断提高识别精度；

当所述不良信息存在概率大于第一预设阈值时，确定所述图片信息中存在不良信息；

当所述网页内容信息包括文本信息时，所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息，包括：

对待识别的所述文本信息进行分句处理，得到多个独立的语句；

对多个独立的所述语句进行关键词分割处理，分析各所述语句中的多个关键词之间的依存关系；

根据所述依存关系，对各所述关键词或多个所述关键词的组合进行负面情感算法识别，判断各所述语句是否具有负面情感；

基于预先构建的敏感词汇库，对各所述关键词进行敏感词汇识别，判断各所述语句是否包含敏感词汇；

如果任一所述语句具有负面情感且包含敏感词汇，则计算所述文本信息的不良信息存在概率；

当所述不良信息存在概率大于第三预设阈值时，确定所述文本信息中存在不良信息；

当所述网页内容信息包括视频信息时，所述分别确定各个所述网页中的所述网页内容信息中是否存在不良信息，包括：

对待识别的所述视频信息进行分帧处理，得到多个视频帧；

逐一对各个所述视频帧进行敏感区域提取处理，得到所述视频帧中的多个敏感区域；

利用不良信息识别模型计算各个所述敏感区域的不良信息匹配度，根据各个所述不良信息匹配度计算所述视频帧的不良信息存在概率；