[发明专利]一种数据处理方法、装置、计算机设备及存储介质在审
申请号: | 202210094037.X | 申请日: | 2022-01-26 |
公开(公告)号: | CN114419514A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 高洵 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06K9/62;G06V10/774 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈梅君 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了一种数据处理方法、装置、计算机设备及存储介质,包括:获取包括M个子数据集的样本数据集;每个子数据集中的媒体数据均关联N个模态类型,每两个子数据集之间存在不同模态类型的媒体数据;获取每个子数据集分别对应的多模态特征;在获取到第(i‑1)次迭代训练后的初始多模态识别模型时,基于多模态特征Xi对初始多模态识别模型进行迭代训练,得到第一训练模型,且基于多模态特征Xi+1对第一训练模型进行迭代训练,直到(i+1)等于M时,得到第二训练模型;基于模型收敛条件以及第二训练模型生成目标多模态识别模型。采用本申请实施例,可以提高匹配度识别的准确度。
技术领域
本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、计算机设备及存储介质。
背景技术
在识别图片数据与视频数据之间的匹配度时,现有匹配度识别方法往往采用人工指定的规则或角度,根据人工经验对视频数据与图片数据进行匹配度识别,这样使得不同的识别对象在针对同一视频图片对(例如,由视频数据a与图片数据b所组成的视频图片对)进行匹配度识别时,得到的匹配结果可能存在不同。比如,识别对象A认为该图片数据b与视频数据a相匹配,在选择该视频数据a的封面图片数据时,极有可能将该图片数据b作为该视频数据a的封面图片数据。而识别对象B认为该图片数据b与视频数据不匹配,在选择视频数据a的封面图片数据时,不会将该图片数据b作为该视频数据a的封面图片数据,这样将降低匹配度识别的准确率。
发明内容
本申请实施例提供一种数据处理方法、装置、计算机设备及存储介质,可以提高匹配度识别的准确度。
本申请实施例一方面提供一种数据处理方法,包括:
获取样本数据集;样本数据集包括M个子数据集,每个子数据集中的媒体数据均关联N个模态类型,每两个子数据集之间存在不同模态类型的媒体数据;M和N均为大于1的正整数;
获取每个子数据集分别对应的多模态特征;M个多模态特征包括多模态特征Xi和多模态特征Xi+1;i为小于M的正整数;
在获取到第(i-1)次迭代训练后的初始多模态识别模型时,基于多模态特征Xi,对初始多模态识别模型进行迭代训练,得到第一训练模型,且基于多模态特征Xi+1,对第一训练模型进行迭代训练,直到(i+1)等于M时,得到第二训练模型;
基于与初始多模态识别模型相关联的模型收敛条件以及第二训练模型,生成目标多模态识别模型;目标多模态识别模型用于识别目标视频数据和待识别图片数据之间的匹配度;样本数据集关联的模态类型包括目标视频数据所关联的模态类型以及待识别图片数据对应的模态类型。
本申请实施例一方面提供一种数据处理装置,包括:
数据集获取模块,用于获取样本数据集;样本数据集包括M个子数据集,每个子数据集中的媒体数据均关联N个模态类型,每两个子数据集之间存在不同模态类型的媒体数据;M和N均为大于1的正整数;
多模态特征获取模块,用于获取每个子数据集分别对应的多模态特征;M个多模态特征包括多模态特征Xi和多模态特征Xi+1;i为小于M的正整数;
迭代训练模块,用于在获取到第(i-1)次迭代训练后的初始多模态识别模型时,基于多模态特征Xi,对初始多模态识别模型进行迭代训练,得到第一训练模型,且基于多模态特征Xi+1,对第一训练模型进行迭代训练,直到(i+1)等于M时,得到第二训练模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210094037.X/2.html,转载请声明来源钻瓜专利网。