[发明专利]一种基于预分类和特征学习抗噪的网络信息检索方法在审

专利信息
申请号: 201811548333.2 申请日: 2018-12-18
公开(公告)号: CN109697257A 公开(公告)日: 2019-04-30
发明(设计)人: 潘颋璇;王斌 申请(专利权)人: 天罡网(北京)安全科技有限公司
主分类号: G06F16/9535 分类号: G06F16/9535;G06N3/04;G06N3/08
代理公司: 北京慧泉知识产权代理有限公司 11232 代理人: 李娜
地址: 100080 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明一种基于预分类和特征学习抗噪的网络信息检索方法,可用于包括文本和图像信息的网络信息快速检索。首先使用深度学习训练网络,选用VGG16的16层深度神经网络,用整流线性单元作为激活函数,在每个完全连接层后添加一个压差层。最后一个完全连接的层具有的节点数为N级,使用softmax函数作为其分类函数。网络训练好后,数据集通过训练网络以前向传播的方式提取特征,用softmax从最后一层获得预分类结果,数据预分类结果提供反馈信息,即属于同一类别网络数据的特征应存储在一起。对新来的查询数据,使用余弦距离度量查询信息与查询中属于同一类别的信息之间的相似度。本发明具有检索效率高,抗噪性能强的优势。
搜索关键词: 预分类 网络信息检索 特征学习 抗噪 查询数据 查询信息 反馈信息 分类函数 激活函数 检索效率 结果提供 抗噪性能 快速检索 神经网络 提取特征 图像信息 网络数据 网络信息 网络训练 线性单元 学习训练 训练网络 余弦距离 节点数 连接层 数据集 相似度 度量 可用 压差 存储 文本 查询 传播 网络
【主权项】:
1.一种基于预分类和特征学习抗噪的网络信息检索方法,其特征在于:该方法具体步骤如下:步骤一、采用深度学习训练网络;采用名为VGG16的16层深度神经网络,并使用转移学习来微调预先训练的网络;其中,卷积图层中的权重是固定的,完全连接的图层会被重新训练以输出数据图像的类别;传输模型的前两个完全连接层有512个节点;为避免拟合,使用整流线性单元ReLU作为激活函数,并在每个完全连接层后添加一个压差层;最后一个完全连接的层具有的节点数为N级,并使用softmax函数作为其分类函数;将上述学习任务作为一个多分类问题进行训练,其中最后一层的输出可以被解释为分类概率的估计;所以这个阶段的损失定义为:其中,W和b是网络参数,n是训练样本的索引,N是训练样本数,yn是标签,xn是网络输出结果;反向梯度损失函数可定义为其中,w和b是网络参数,n是训练样本的索引,N是训练样本数,yn是标签,xn是网络输出结果;利用梯度下降算法根据公式(2)计算w和b,并得到公式(1)损失函数的最优解;对于一个新的查询网络信息xj,它属于类别C的概率(Prob)为:[Prob,C]=max(WTxj+b)  (3)其中,W和b是网络参数;步骤二、特征学习和预分类按照步骤一进行网络训练后,数据集通过训练网络以前向传播的方式提取特征,获得了Fc2层每个网络信息的特征向量,并使用softmax从最后一层获得预分类结果;之后,数据预分类的结果提供反馈信息,即属于同一类别的网络数据的特征应该存储在一起;对于新来的查询数据,使用余弦距离来度量查询信息与查询中属于同一类别的信息之间的相似度;整个过程将分为离线处理阶段和在线处理阶段两个部分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天罡网(北京)安全科技有限公司,未经天罡网(北京)安全科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811548333.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top