[发明专利]一种基于实体关系抽取的视频描述方法与装置在审

申请号：	201910862713.1	申请日：	2019-09-12
公开（公告）号：	CN110688916A	公开（公告）日：	2020-01-14
发明（设计）人：	钟珞;陈淑琴;钟忺;袁景凌;李琳;宋华珠;黄文心;谬永飞;罗振军	申请（专利权）人：	武汉理工大学
主分类号：	G06K9/00	分类号：	G06K9/00;G06N3/04;G06F16/71;G06F16/783
代理公司：	42102 湖北武汉永嘉专利代理有限公司	代理人：	钟锋
地址：	430070 湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于实体关系抽取的视频描述方法与装置，该方法包括以下步骤：1)获取视频数据集，并对视频进行特征提取；所述特征包括二维、三维特征以及二者的混合特征；2)对视频中出现的实体进行抽取，然后对实体关系进行向量化表征；3)根据提取的视频特征和实体关系表征，获得视频描述；4)提取视频的关键词，将关键词与多个视频描述进行结合，对所有生成的句子进行排序，排序最靠前的句子即为最终的视频描述。本发明方法通过抽取视频中的实体，生成实体关系并加入到词表中，解决语料不足的问题；通过attention机制和实体关系对句子生成进行改进，产生的视频描述句子能更加准确和恰当能还原视频所要表达的内容。
搜索关键词：	实体关系视频描述视频句子抽取排序词表还原视频混合特征句子生成三维特征视频数据视频特征特征提取向量化二维语料改进
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于实体关系抽取的视频描述方法，其特征在于，包括以下步骤：/n1)获取视频数据集，并对视频进行特征提取；所述特征包括二维、三维特征以及二者的混合特征；/n2)对视频中出现的实体进行抽取，然后对实体关系进行向量化表征；/n2.1)对视频中出现的实体进行抽取，抽取的实体按照时间顺序进行排列，并按照此顺序进行配对，配对得到实体对作为实体关系；/n2.2)对步骤2.1)中的实体关系在关系库中进行索引和查找，将找到的全部关系以及关系词添加到词表中，完成对缺失词的填充；/n2.3)对实体关系进行向量化表征；/n3)根据提取的视频特征和实体关系表征，获得视频描述；/n3.1)采用LSTM对步骤1)提取的视频特征进行编码，并保存经过LSTM网络层之后的隐藏状态；/n3.2)构建用于视频描述输出语言模型，语言模型的输入包含编码阶段的视频输入，attention权重矩阵，以及在不同时刻的实体关系向量；/n所述attention权重矩阵通过语言模型的隐藏状态和步骤3.1)保存的隐藏状态进行相似度计算获得；/n3.3)根据语言模型的输出，获得多个视频描述；/n4)提取视频的关键词，将关键词与多个视频描述进行结合，对所有生成的句子进行排序，排序最靠前的句子即为最终的视频描述。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉理工大学，未经武汉理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910862713.1/，转载请声明来源钻瓜专利网。

上一篇：一种用于视障人士自主出行的安全设备
下一篇：一种物体检测模型生成方法、装置及物体检测方法、装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于实体关系抽取的视频描述方法与装置在审

专利文献下载