[发明专利]标签预测方法、装置、设备及存储介质在审
申请号: | 202110150871.1 | 申请日: | 2021-02-03 |
公开(公告)号: | CN113010705A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 蓝玮毓 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48;G06F16/435 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 预测 方法 装置 设备 存储 介质 | ||
1.一种标签预测方法,其特征在于,包括:
对目标多媒体数据进行标签预测处理,得到所述目标多媒体数据的标签预测集,所述标签预测集包括所述目标多媒体数据的N个预测标签,以及每个预测标签的预测准确度,N为大于等于1的整数;
从所述标签预测集中筛选出满足标签层级关系的M个参考标签,M为大于1,且小于N的整数;
根据所述标签层级关系对每个参考标签的预测准确度进行修正,并采用修正后的预测准确度更新所述标签预测集;
从更新后的标签预测集中选取所述目标多媒体数据的标注标签。
2.根据权利要求1所述的方法,其特征在于,所述预测准确度包括预测分值,所述从所述标签预测集中筛选出满足标签层级关系的M个参考标签,包括:
从所述标签预测集中确定出所属层级为第一层级的预测标签的参考预测分值,满足所述标签层级关系的预测标签的所属层级从第一层级开始依次递减;
从确定的参考预测分值中筛选出超过分数阈值的分值,并确定每个超过所述分数阈值的分值的参考预测标签;
将每个超过所述分数阈值的分值的参考预测标签的M个下级标签作为参考标签。
3.根据权利要求1所述的方法,其特征在于,所述预测准确度包括预测分值;所述根据所述标签层级关系对每个参考标签的预测准确度进行修正,包括:
获取每个参考标签的上级标签的预测分值,所述预测分值是采用第一打分函数对相应参考标签进行打分处理得到的;
调用第二打分函数根据每个参考标签的上级标签的预测分值,对相应参考标签的预测分值进行修正,其中,对应上级标签的预测分值高的参考标签修正后的预测分值,高于对应上级标签的预测分值低的参考标签修正后的预测分值。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述目标多媒体数据进行特征提取处理,得到所述目标多媒体数据的特征数据;
根据所述目标多媒体数据的特征数据,从多媒体知识库中获取与所述目标多媒体数据的相似度满足相似度阈值的参考多媒体数据,以及所述参考多媒体数据的标注标签;
根据所述参考多媒体数据的标注标签,确定所述目标多媒体数据的标注标签。
5.根据权利要求4所述的方法,其特征在于,所述参考多媒体数据的数量为多个,任一参考多媒体数据的标注标签的数量为一个或多个;所述根据所述参考多媒体数据的标注标签,确定所述目标多媒体数据的标注标签,包括:
统计任一参考多媒体数据的任一标签,在多个参考多媒体数据对应的标注标签中的出现次数;
按照所述出现次数,对所述参考多媒体数据的标注标签进行排序,并将对应顺序大于等于预设顺序阈值的标注标签作为所述目标多媒体数据的标注标签。
6.根据权利要求1所述的方法,其特征在于,所述目标多媒体数据包括一帧或多帧图像;所述对目标多媒体数据进行标签预测处理,得到所述目标多媒体数据的标签预测集,包括:
提取目标多媒体数据的每帧图像的特征数据,得到所述目标多媒体数据的多个特征数据;
对提取得到的多个特征数据进行下采样处理,得到所述目标多媒体数据对应的目标特征数据;
根据所述目标特征数据对所述目标多媒体数据进行标签预测处理,得到所述目标多媒体数据的标签预测集。
7.根据权利要求6所述的方法,其特征在于,所述根据所述目标特征数据对所述目标多媒体数据进行标签预测处理,得到所述目标多媒体数据的标签预测集,包括:
获取标签词汇集,所述标签词汇集是从标签训练集包括的样本多媒体数据的标注标签选取出的;
根据所述目标特征数据,从所述标签词汇集中获取与所述目标特征数据匹配的N个标签词汇,并将所述N个标签词汇添加到所述目标多媒体数据的标签预测集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110150871.1/1.html,转载请声明来源钻瓜专利网。