[发明专利]一种类级别对比学习的弱监督文本行人检索方法及系统在审
申请号: | 202311204550.0 | 申请日: | 2023-09-19 |
公开(公告)号: | CN116935329A | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 郑艳伟;赵新鹏;王鹏;孙恩涛;杜超;于东晓 | 申请(专利权)人: | 山东大学;上海新时达电气股份有限公司 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V20/40;G06V10/762;G06V10/774;G06V10/75 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 付秀颖 |
地址: | 266200 山*** | 国省代码: | 山东;37 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本申请属于图像处理领域,尤其涉及一种类级别对比学习的弱监督文本行人检索方法及系统,用于包括但不限于电梯、街道、商场等一切具有行人的场景,通过输入自然语言描述对行人图像或视频进行检索,该方法采用CLIP的预训练模型来提取图像和文本的特征,并使用了离异样本挖掘算法来挖掘其中有价值的聚类离异样本。之后根据聚类ID构建类级别的多模态记忆模块,该模块在训练过程中会动态更新。训练时,混合级别的跨模态匹配模块从类级别和实例级别两个角度拉近同类图像和文本之间的距离,推远不同类图像和文本之间的距离。本发明大幅度提高了弱监督条件下文本行人检索的准确率。 | ||
搜索关键词: | 种类 级别 对比 学习 监督 文本 行人 检索 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学;上海新时达电气股份有限公司,未经山东大学;上海新时达电气股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202311204550.0/,转载请声明来源钻瓜专利网。