[发明专利]一种基于点击与视觉融合的弱监督双线性深度学习方法有效

申请号：	201710059373.X	申请日：	2017-01-24
公开（公告）号：	CN106919951B	公开（公告）日：	2020-04-21
发明（设计）人：	俞俊;谭敏;郑光剑	申请（专利权）人：	杭州电子科技大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06F16/583
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	杜军
地址：	310018 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于点击与视觉融合的弱监督双线性深度学习方法。本发明包括如下步骤：1、从点击数据集中提取每幅图像的文本构成的点击特征，并通过合并语义相近的文本，在合并后的文本空间下构建新的低维紧凑的点击特征；2、点击与视觉特征融合的深度模型构建；3、BP学习网络模型参数；4、计算每一个训练样本的模型预测损失，并构造样本集的相似度矩阵，同时利用样本损失和相似度矩阵学习样本可靠性，利用可靠性给样本加权；5、重复步骤3和4，迭代地优化神经网络模型和样本权重，从而训练整个网络模型直到收敛。本发明融合了点击数据和视觉特征从而构造了新的双线性卷积神经网络框架，能用来更好的对细粒度图像进行识别。
搜索关键词：	一种基于点击视觉融合监督双线深度学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于点击与视觉融合的弱监督双线性深度学习方法，其特征在于包括如下步骤：步骤(1)、点击数据预处理：从点击数据集中提取每幅图像的文本构成的点击特征，并通过合并语义相近的文本，在合并后的文本空间下构建新的低维紧凑的点击特征；步骤(2)、点击与视觉特征融合的深度模型构建：对样本基于可靠性加权，构建一个带权重的三通道深度神经网络模型，其中两个通道提取图像视觉特征，第三通道处理步骤1的点击特征；将视觉与点击特征通过特征连接层进行融合；步骤(3)、BP学习模型参数：通过反向传播算法对步骤(2)中神经网络的网络模型参数进行训练，直至整个网络模型收敛；步骤(4)、学习样本可靠性：根据步骤(2)的神经网络模型，计算每一个训练样本的模型预测损失，并构造样本集的相似度矩阵，同时利用样本损失和相似度矩阵学习样本可靠性，利用可靠性给样本加权；步骤(5)、模型训练：重复步骤3和4，迭代地优化神经网络模型和样本权重，从而训练整个网络模型直到收敛。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学，未经杭州电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710059373.X/，转载请声明来源钻瓜专利网。

上一篇：扎毛机
下一篇：一种用于不同年龄段的简易升降学习桌

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于点击与视觉融合的弱监督双线性深度学习方法有效

专利文献下载