[发明专利]一种基于深度学习的互联网问题地图筛查方法在审
申请号: | 201910616225.2 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110334228A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 朱明;刘波;贺雨晴;秦绍峰;林晓媛;何永宁;吴博;廖珊珊 | 申请(专利权)人: | 广西壮族自治区基础地理信息中心 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06F16/583;G06K9/62;G06N3/04 |
代理公司: | 南宁深之意专利代理事务所(特殊普通合伙) 45123 | 代理人: | 徐国华 |
地址: | 530023 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度学习的互联网问题地图筛查方法,主要包括收集样本库、清洗样本库获得数据集文件、通过深度卷积神经网络算法对数据集文件训练计算获得地图模型、导入地图模型文件对网站图片进行筛查识别判断、标记问题地图并导出。本发明能够辅助互联网地图监管部门,对海量网络图片进行快速检索,识别地图图片,并判断地图是否合格;营造良好的网络和地图市场环境,切实增强互联网和出版企业国家版图意识和地理信息安全意识,维护国家领土主权、安全和利益。 | ||
搜索关键词: | 筛查 地图模型 数据集 样本库 互联网 地理信息安全 卷积神经网络 互联网地图 地图图片 国家版图 海量网络 监管部门 快速检索 领土主权 市场环境 网站图片 导出 算法 清洗 学习 出版 网络 安全 维护 图片 | ||
【主权项】:
1.一种基于深度学习的互联网问题地图筛查方法,其特征在于,包括以下步骤:步骤一,收集大量图片样本,然后根据地图绘制法律法规的要求进行整理样本图片,将样本图片重新归为两大类并进行标记:合格的标准地图样本库、不合格的“问题地图”样本库;步骤二,对步骤一中获得的合格的标准地图样本库和不合格的“问题地图”样本库分别进行清洗,然后将清洗后的合格的标准地图样本库和不合格的“问题地图”样本库分别进行二进制编码压缩成两个数据集文件;所述的清洗步骤包括:1)删除大小小于10KB或图片宽高都小于50像素的图片;2)删除清晰度不高、模糊不清或者水印多的图片;3)将所有剩余图片进行灰度处理、线性拉伸、加入随机噪声;4)将经过步骤3)处理之后的图片进行格式修改,统一为jpg格式;步骤三,将步骤二制作好的数据集文件进行训练计算,即通过深度卷积神经网络算法对数据集文件中的图像矩阵进行卷积计算,得出对应的特征矩阵,通过重复多次卷积计算操作,提取出数据集文件中图像数据的特征信息;将提取出来的特征信息和标记进行对比计算结果精度,并将计算出来的误差值进行反向传播回去调整深度卷积神经网络算法的网络参数,在反复多次计算之后,如果结果精度不再提高,即为达到拟合;拟合之后将深度卷积神经网络算法中所有的网络参数进行保存,保存得到的数据文件即为模型文件,包括标准地图模型和“问题地图”模型;步骤四,按照给定网址检索网站图片,导入步骤三中训练计算得到的模型文件,对该网站图片进行识别判断,具体为:1)将网站图片按照512*512像素规格进行裁切;2)将裁切后的网站图片依次导入resnet残差网络运算;3)提取并导出特征值;即resnet残差网络会根据输入图片表现抢眼的特征进行提取,获得表示该图片的特征值的二维矩阵数据;4)判断是否符合地图特征值;通过第3)步提取的特征值转换为一个大于0小于1的数值,如果这个数值大于0.5,那么可以判断这样图片是地图,小于0.5则表示这张图片不是地图;5)判断为否,则标记为非地图图片,运算结束;6)判断为是,则标记为地图图片,进行第7)步运算;7)将地图图片与问题地图特征对比;将第3)步中提取的二维矩阵数据与步骤三中训练好的“问题地图”模型进行求差计算,判断是否拟合“问题地图”模型;8)判断为是,则标记为问题地图,运算结束;步骤五,导出识别结果报表,对疑似“问题地图”的网站图片进行标记,标记后,整个互联网问题地图筛查流程结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西壮族自治区基础地理信息中心,未经广西壮族自治区基础地理信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910616225.2/,转载请声明来源钻瓜专利网。
- 上一篇:办案管理系统
- 下一篇:可视化显示方法、设备、系统及计算机可读存储介质