[发明专利]基于深度迁移学习的视频描述方法有效
申请号: | 201810465849.4 | 申请日: | 2018-05-15 |
公开(公告)号: | CN108765383B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 张丽红;曹刘彬 | 申请(专利权)人: | 山西大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 太原晋科知识产权代理事务所(特殊普通合伙) 14110 | 代理人: | 任林芳 |
地址: | 030006*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于视频处理技术领域,具体是一种基于深度迁移学习的视频描述方法。包括以下步骤,1)通过卷积神经网络视频表示模型,将视频表示为向量形式;2)利用多示例学习构建图像语义特征检测模型,以提取图像域语义特征;3)将步骤2)中的图像语义特征检测模型迁移到帧流域中,得到帧流语义特征检测模型,以提取帧流语义特征,并实现图像域与帧流域语义特征的深度融合;4)构建深度迁移学习视频描述框架,生成视频自然语言描述。本发明对输入端不同域中的语义特征进行深度融合,以提高生成视频描述的准确率。 | ||
搜索关键词: | 基于 深度 迁移 学习 视频 描述 方法 | ||
【主权项】:
1.一种基于深度迁移学习的视频描述方法,其特征在于:包括以下步骤,1)通过卷积神经网络视频表示模型,将视频表示为向量形式;2)利用多示例学习构建图像语义特征检测模型,以提取图像域语义特征;3)将步骤2)中的图像语义特征检测模型迁移到帧流域中,得到新的语义特征检测模型,以提取帧流语义特征,并实现图像域与帧流域语义特征的深度融合;4)构建深度迁移学习视频描述框架,生成视频自然语言描述。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西大学,未经山西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810465849.4/,转载请声明来源钻瓜专利网。