[发明专利]一种数据集的确定方法、装置、计算机设备以及存储介质在审

专利信息
申请号: 202110986886.1 申请日: 2021-08-26
公开(公告)号: CN113704519A 公开(公告)日: 2021-11-26
发明(设计)人: 张元瀚;黄耿石;刘冬阳;滕家宁;王坤;尹榛菲;邵婧 申请(专利权)人: 北京市商汤科技开发有限公司
主分类号: G06F16/51 分类号: G06F16/51;G06F16/55;G06F16/58
代理公司: 北京中知恒瑞知识产权代理事务所(普通合伙) 11889 代理人: 袁忠林
地址: 100080 北京市海淀区北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 确定 方法 装置 计算机 设备 以及 存储 介质
【说明书】:

本公开提供了一种数据集的确定方法、装置、计算机设备以及存储介质,其中,该方法包括:获取包含多个语义信息的语义数据库;基于所述语义数据库创建多个标签数据;每个标签数据对应一个语义类别,每个标签数据包含所属于对应语义类别的物体标签;所述多个标签数据对应的语义类别为能够对待测试模型进行全方位表示测试的类别;基于预设数据集合,为各个所述标签数据的物体标签确定相匹配数据,并基于所述相匹配数据确定每个所述标签数据对应的测试数据集合,得到多个测试数据集合。

技术领域

本公开涉及计算机技术领域,具体而言,涉及一种数据集的确定方法、装置、计算机设备以及存储介质。

背景技术

在计算机视觉领域,需要对设计好的模型进行性能测试,此时,可以根据相应的测试集对设计好的模型进行性能测试。然而,现有的测试集通常为预先已经设定好的数据集,例如,ImageNet数据集等。由于现有的测试集中包含在各种场景下包含多种类型的物体的测试数据,因此,通过现有的测试集对模型进行测试时,无法反应出该模型针对各种类型的物体所对应的测试数据的测试性能。此时,在采用现有的测试集对模型进行性能测试时,将影响该模型的鲁棒性,从而影响该模型的处理精度。

发明内容

本公开实施例至少提供一种数据集的确定方法、装置、计算机设备以及存储介质。

第一方面,本公开实施例提供了一种数据集的确定方法,包括:获取包含多个语义信息的语义数据库;基于所述语义数据库创建多个标签数据;每个标签数据对应一个语义类别,每个标签数据包含所属于对应语义类别的物体标签;所述多个标签数据对应的语义类别为能够对待测试模型进行全方位表示测试的类别;基于预设数据集合,为各个所述标签数据的物体标签确定相匹配数据,并基于所述相匹配数据确定每个所述标签数据对应的测试数据集合,得到多个测试数据集合。

通过上述描述可知,本公开实施例通过对语义数据库进行处理得到对应多个语义类别的标签数据,并基于确定出的多个标签数据创建对应多个语义类别的测试数据集合的方式,可以得到对应多个语义类别的测试数据集合,在通过确定出的多个测试数据集合对待测试模型进行性能测试时,可以实现全方位对待测试模型进行测试,从而得到待测试模型的全方位表示性能。通过该测试方式,可以提高待测试模型的鲁棒性,进而提高待测试模型的模型处理精度。

一种可选的实施方式中,所述语义数据库为多个,所述基于所述语义数据库创建多个标签数据,包括:将多个语义数据库中的语义信息进行融合,得到融合语义数据库;其中,所述融合语义数据库中包含多个融合语义信息和多个融合语义信息之间的层次信息;确定待划分的多个语义类别,并按照所述多个语义类别对所述融合语义数据库划分为所述多个标签数据。

通过上述描述可知,通过将多个语义数据库进行语义融合,可以得到更加全面的语义数据库,即融合语义数据库。在根据该融合语义数据库确定多个标签数据时,就可以得到语义类别更加丰富的标签数据,通过该多个标签数据所对应测试数据集合对待测试模型进行测试时,可以实现待测试模型的全方位测试,从而得到待测试模型的全方位表示性能。

一种可选的实施方式中,所述将多个语义数据库中的语义信息进行融合,得到融合语义数据库,包括:在所述多个语义数据库的第一语义数据库中确定待融合语义信息;所述待融合语义信息在所述第一语义数据库中不包含下一层级的语义信息;基于所述第一语义数据库中语义信息间的层次信息,确定所述待融合语义信息所在的语义路径,所述语义路径包含至少一个语义信息;基于所述语义路径中位于所述待融合语义信息之前的高层次语义信息,将所述待融合语义信息和第二语义数据库中的语义信息进行融合,得到所述融合语义数据库,所述第二语义数据库为所述多个语义数据库中除所述第一语义数据库之外的数据库。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110986886.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top