[发明专利]一种数据处理方法、设备及存储介质在审
申请号: | 201910319953.7 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110046586A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 徐兴坤 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象特征 样本对象 对象特征信息 存储介质 对象标签 数据处理 标签 多媒体数据 对象识别 对象数据 人脸识别 异类 簇确定 准确率 聚类 合并 更新 | ||
1.一种数据处理方法,其特征在于,包括:
从多个多媒体数据中分别获取样本对象数据,提取所述样本对象数据的对象特征信息;
根据所述对象特征信息对多个样本对象数据进行聚类,得到多个具有不同簇标签的第一对象特征簇;所有样本对象数据的对象标签均与所属的第一对象特征簇的簇标签相同;
分别清理每个第一对象特征簇中的异类对象数据,将清理后的第一对象特征簇确定为第二对象特征簇;
在多个第二对象特征簇之间进行同类簇合并,生成多个具有不同簇标签的第三对象特征簇,将所述样本对象数据的对象标签更新为所属的所述第三对象特征簇的簇标签;
基于所述每个第三对象特征簇中的所述样本对象数据的对象标签和所述对象特征信息,训练对象识别模型;所述对象识别模型用于识别待预测对象数据与目标对象数据之间的相似度。
2.根据权利要求1所述的方法,其特征在于,所述从多个多媒体数据中分别获取样本对象数据,提取所述样本对象数据对应的对象特征信息,包括:
获取多个多媒体数据中的对象位置信息,根据所述对象位置信息从每个多媒体数据中分别获取具有目标尺寸的对象区域,将所述对象区域中的图像内容确定为样本对象数据,获取所述每个样本对象数据的对象特征信息;
若所述多媒体数据为图像数据,则为所述图像数据中的所述样本对象数据随机设置对象标签;
若所述多媒体数据为视频数据,则检测所述样本对象数据在所述视频数据中的跟踪轨迹信息,将具有相同所述跟踪轨迹信息的样本对象数据设置关联属性,并为具有所述关联属性的样本对象数据设置相同的对象标签。
3.根据权利要求2所述的方法,其特征在于,所述将所述对象区域中的图像内容确定为样本对象数据,包括:
将所述对象区域中的图像内容进行基于目标方位的仿射变换,将仿射变换后的图像内容确定为样本对象数据;所述样本对象数据中的对象处于所述目标方位;
则所述方法还包括:
获取待预测多媒体数据;
根据所述待预测多媒体数据中的对象位置信息获取具有目标尺寸的目标对象区域,将所述目标对象区域中的待预测图像内容进行基于所述目标方位的仿射变换,将仿射变换后的待预测图像内容确定为待预测对象数据;
基于对象识别模型获取待预测对象数据与目标对象数据之间的相似度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述对象特征信息对多个样本对象数据进行聚类,得到多个具有不同簇标签的第一对象特征簇,包括:
从多个样本对象数据中获取第一样本对象数据和第二样本对象数据,将所述第一样本对象数据的对象标签确定为第一对象标签,将所述第二样本对象数据的对象标签确定为第二对象标签;所述第一对象标签和所述第二对象标签不相同;
获取所述第一样本对象数据的对象特征信息和所述第二样本对象数据的对象特征信息之间的第一图像相似度;
若所述第一图像相似度大于第一阈值,则将具有所述第一对象标签的至少一个样本对象数据和具有第二对象标签的至少一个样本对象数据,划分到相同的第一对象特征簇,并将第一对象标签和第二对象标签设置为所划分的第一对象特征簇的簇标签;
当所有样本对象数据均被划分到所属的第一对象特征簇时,并将每个第一对象特征簇以及所述对象特征簇中的样本对象数据进行存储。
5.根据权利要求1所述的方法,其特征在于,所述分别清理每个第一对象特征簇中的异类对象数据,将清理后的第一对象特征簇确定为第二对象特征簇,包括:
响应针对所述第一对象特征簇的第一标记操作,将所述第一标记操作所指示的所述第一对象特征簇中的样本对象数据,确定为所述第一对象特征簇对应的标准对象数据;
响应针对非标准对象数据的第二标记操作,将所述第二标记操作所指示的非标准对象数据确定为异类对象数据;所述非标准对象数据为所述第一对象特征簇中除所述标准对象数据之外的样本对象数据;
将所述异类对象数据从所述第一对象特征簇中删除,将删除异类对象数据的第一对象特征簇确定为第二对象特征簇。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910319953.7/1.html,转载请声明来源钻瓜专利网。