[发明专利]视频属性表示学习方法及视频文字描述自动生成方法有效

专利信息
申请号: 201710505206.3 申请日: 2017-06-28
公开(公告)号: CN107239801B 公开(公告)日: 2020-07-28
发明(设计)人: 李腾;年福东;李飞凤 申请(专利权)人: 安徽大学;淮南联合大学
主分类号: G06K9/62 分类号: G06K9/62;G06K9/00
代理公司: 合肥市浩智运专利代理事务所(普通合伙) 34124 代理人: 丁瑞瑞
地址: 230000 *** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 属性 表示 学习方法 文字描述 自动 生成 方法
【说明书】:

发明公开了一种视频属性表示学习方法,包括下述步骤:收集一批数据用于视频文字自动描述算法的训练与测试,数据要求每个视频对应几句对应的文字描述;定义训练集中的文字描述内容中出现的所有的名词、动词、和形容词作为对应视频的属性标注信息,则训练集中的每个视频都对应多个属性标签;将一段视频序列表示为单幅图像,从而将复杂困难的视频序列多分类问题转化为较为简单的单幅图片多标签分类问题。本发明还公开一种基于上述视频属性表示学习方法的视频文字描述自动生成方法。本发明的优点在于:提供一种高效的提取视频的属性特征表示,采用本发明的融合方法,能够得到完整的可反映视频属性语义信息的文字描述自动生成方法。

技术领域

本发明涉及一种计算机视觉领域,更具体涉及一种视频文字描述自动生成方法。

背景技术

视频文字描述自动生成是指给定一段视频序列,通过算法自动的生成与视频内容相关的文字描述。由于视频内容的复杂性,传统的基于搜索模型或者基于语言模型的算法效果一直较差。近年来,随着深度学习技术的发展,基于卷积神经网络(CNN)加循环神经网络(RNN)的算法取得了令人振奋的效果。这一系列算法的基本步骤如下:(1)通过CNN(二维卷积或者三维卷积)提取视频的特征向量,随后将视频特征向量通过一个映射函数编码为语言模型需要的特征向量;(2)将步骤(1)获得的特征向量作为语言解码模型RNN的输入进而输出文字描述;(3)通过大量人工标注的视频-文本对训练集同时迭代优化步骤(1)中的编码模型和步骤(2)中的解码模型。

通过分析上述步骤易知在编解码模型固定的情况下,视频的特征提取对最终生成的文字描述效果占主导地位。目前的视频文字描述自动生成方法中的视频特征提取算法主要分为两大类:(1)在一个大规模的图片分类数据集中训练一个CNN模型,用此训练完成的CNN模型提取视频的每一帧或者采样帧的特征,然后通过级联、均值或池化等操作获得视频的特征向量;(2)预先在一个大规模视频分类数据集上训练一个三维卷积神经网络(3D-CNN)来提取输入视频的包含运动信息的特征。虽然这两类方法都取得了不错的效果,但这两类方法提取视频特征的模型都是在第三方数据集上进行训练,这就意味着视频文字描述数据集中的视频并未被利用进行视频特征提取的训练。显然,目前用于视频文字自动描述生成的视频特征提取算法丧失了大量视频的语义信息。

发明内容

本发明所要解决的技术问题之一在于提供了一种如何提取可用于视频文字描述自动生成的视频语义信息的视频属性表示学习方法。

本发明所要解决的技术问题之二在于提供了一种如何将提取到的视频语义信息与现有视频文字描述自动生成编解码模型融合,以提高最终生成文字描述的质量的视频文字描述自动生成方法。

本发明是通过以下技术方案解决上述技术问题之一的:一种视频属性表示学习方法,用于提取可用于视频文字描述自动生成的视频语义信息,包括下述步骤:

步骤1)收集一批数据用于视频文字自动描述算法的训练与测试,数据要求每个视频对应几句对应的文字描述;

步骤2)本发明定义训练集中的文字描述内容中出现的所有的名词、动词、和形容词作为对应视频的属性标注信息,则训练集中的每个视频都对应多个属性标签,因此视频的属性表示学习即可看作视频的多分类问题;

步骤3)直接对视频序列做多分类训练是极为困难的,为了解决此问题,本发明设计一种新颖高效的视频表示算法,可将一段视频序列表示为单幅图像,从而将复杂困难的视频序列多分类问题转化为较为简单的单幅图片多标签分类问题,该视频表示算法具体为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽大学;淮南联合大学,未经安徽大学;淮南联合大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710505206.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top