[发明专利]视频多事件的裁剪及文本描述方法及其装置、设备和介质有效
申请号: | 201910223219.0 | 申请日: | 2019-03-22 |
公开(公告)号: | CN111723238B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 黄义镛;胡强 | 申请(专利权)人: | 曜科智能科技(上海)有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/71;G06F16/738;G06N3/0464 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 高彦 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供的一种视频多事件的裁剪及文本描述方法及其装置、设备和介质,通过光流法对视频去抖动,通过进行3D卷积得到视频的时空特征,并生成多个包含一个事件的候选时间区间特征,对候选时间区间微调后得到多个包含一个事件准确起始和结束时间的短视频;然后对每个短视频的视频帧图像通过预训练的网络得到2D卷积特征,通过双向LSTM编码器模型得到视频内容的上下文信息,最后通过LSTM解码器逐个生成单词得到每个短视频中事件的描述,从而得到针对完整视频的完整描述。本申请对事件视频截取采用了卷积神经网络,能够并行处理从而提高了处理速度,能够高效准确地提取视频过程中的每个事件且无需人工观看视频,还便于后续事件视频检索与统计。 | ||
搜索关键词: | 视频 多事 裁剪 文本 描述 方法 及其 装置 设备 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曜科智能科技(上海)有限公司,未经曜科智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910223219.0/,转载请声明来源钻瓜专利网。