[发明专利]数据处理方法和装置、电子设备和计算机可读存储介质有效
申请号: | 201810607823.9 | 申请日: | 2018-06-13 |
公开(公告)号: | CN108984618B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 吴凌云;罗平;彭章琳;任家敏;张瑞茂;王新江 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/955 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
按照层级扩展的方式,获取基于种子标签的多层级标签结构,以及获取所述多层级标签结构中各标签对应的数据,其中所述多层级标签结构中的第i+1层的标签是由第一层至第i层对应的标签形成的组合标签的扩展标签,其中i为大于或者等于1且小于N的正整数,N为所述多层级标签结构的层数,且N大于1;
基于所述多层级标签结构,获取至少一个数据集合,所述数据集合包括至少一个数据以及该数据对应的标签,所述数据集合用于训练网络模型。
2.根据权利要求1所述的方法,其特征在于,所述按照层级扩展的方式,获取基于种子标签的多层级标签结构包括:
将所述种子标签作为与其对应的所述多层级标签结构的第一层标签;
将第i层的第一标签以及前i-1层与所述第一标签对应的第二标签组合形成组合标签;
获取所述组合标签的扩展标签,所述扩展标签为所述多层级标签结构的第i+1层与所述组合标签对应的标签。
3.根据权利要求2所述的方法,其特征在于,其中,所述获取所述组合标签的扩展标签包括:
通过查询第一数据库,获取所述组合标签的扩展标签,其中所述第一数据库中包括各标签及其扩展标签;或者
通过向网络搜索引擎请求获取组合标签的扩展标签。
4.根据权利要求1所述的方法,其特征在于,所述获取所述多层级标签结构中各标签对应的数据包括:
获得与所述种子标签对应的第一数据;以及
将第i层的第一标签以及前i-1层与所述第一标签对应的第二标签组合形成组合标签;
获得与所述组合标签对应的第二数据。
5.根据权利要求4所述的方法,其特征在于,其中,所述获得与所述种子标签对应的第一数据包括:
通过查询第二数据库,获得与所述种子标签对应的第一数据,所述第二数据库中包括多个第一数据,每个第一数据对应有至少一种标签;或者
利用网络搜索引擎获取所述种子标签对应的第一数据。
6.根据权利要求4所述的方法,其特征在于,其中,所述获得与所述组合标签对应的第二数据包括:
通过查询第二数据库,获得与所述组合标签对应的第二数据,所述第二数据库中包括标签以及与该标签对应的数据;或者
利用网络搜索引擎获取所述组合标签对应的第二数据。
7.根据权利要求1所述的方法,其特征在于,所述基于所述多层级标签结构,获取至少一个数据集合包括:
利用预设筛选方式,从获得的数据中获取第三数据;
获取第三数据中各数据对应的第三标签;
基于所述第三标签和第三数据形成所述数据集合,
其中,所述预设筛选方式包括随机筛选方式或者基于数据对应的标签的类别执行筛选的方式。
8.根据权利要求1所述的方法,其特征在于,所述基于所述多层级标签结构,获取至少一个数据集合包括:
对所述多层级标签结构中的各标签进行归类处理,形成关于至少一个类别的标签树结构;
基于所述标签树结构获得所述数据集合。
9.根据权利要求8所述的方法,其特征在于,所述对所述多层级标签结构中的各标签进行归类处理,形成关于至少一个类别的标签树结构包括:
对所述种子标签进行第一归类处理,建立关于至少一个类别的第一标签树结构,所述类别包括物体、地点、事件和时间中的至少一种;
对所述种子标签以外的其余标签进行第二归类处理,形成基于所述第一标签树结构的第二标签树结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810607823.9/1.html,转载请声明来源钻瓜专利网。