[发明专利]基于关系推理网络的视频和文本的跨模态检索方法有效
申请号: | 202110451431.X | 申请日: | 2021-04-26 |
公开(公告)号: | CN113239159B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 沈复民;徐行;王妮;邵杰;申恒涛 | 申请(专利权)人: | 成都考拉悠然科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/532;G06F16/583;G06V20/40;G06V10/82;G06N3/0442 |
代理公司: | 成都君合集专利代理事务所(普通合伙) 51228 | 代理人: | 张鸣洁 |
地址: | 610041 四川省成都市中国(四川)自由贸易试验区成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及跨模态检索领域,公开了一种基于关系推理网络的视频和文本的跨模态检索方法,包括:提取视频数据特征和文本数据特征;运用循环神经网络获取视频全局特征和文本全局特征;运用多尺度关系推理网络构建视频局部关系特征和文本局部关系特征;分别融合单模态数据的全局特征和局部关系特征获得视频融合特征和文本融合特征;映射视频融合特征和文本融合特征到公共空间,并对齐公共空间中的视频融合特征分布和文本融合特征分布;对整体网络进行训练。本发明同时关注全局特征和局部关系特征,能更有效的聚焦到单模态数据中的重点信息,进而实现跨模态检索。 | ||
搜索关键词: | 基于 关系 推理 网络 视频 文本 跨模态 检索 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都考拉悠然科技有限公司,未经成都考拉悠然科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110451431.X/,转载请声明来源钻瓜专利网。