[发明专利]标签的处理方法及装置有效
申请号: | 201510707963.X | 申请日: | 2015-10-27 |
公开(公告)号: | CN106611015B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 王江;黄畅 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/45 | 分类号: | G06F16/45;G06F16/48;G06K9/62 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 处理 方法 装置 | ||
1.一种标签的处理方法,其特征在于,包括:
获取资源的语义特征数据;
根据所述资源的语义特征数据,获得所述资源的至少一个标签序列的后验概率;
根据所述后验概率,选择一个标签序列,以作为所述资源的标签集合;其中,
所述根据所述资源的语义特征数据,获得所述资源的至少一个标签序列的后验概率,包括:
根据所述资源的语义特征数据,利用预先构建的递归神经网络,获得所述资源的至少一个标签序列的后验概率;
所述方法还包括:
获得第二训练样本集中每个第二训练样本的样本序列;
获取所述第二训练样本集中每个第二训练样本中所包含的一个资源的语义特征数据;
根据所述每个第二训练样本的样本序列和所述每个第二训练样本中所包含的一个资源的语义特征数据,构建所述递归神经网络。
2.根据权利要求1所述的方法,其特征在于,所述获取资源的语义特征数据,包括:
利用预先构建的卷积神经网络,对所述资源进行处理,以获得所述资源的语义特征数据。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据标签在第一训练样本集中的出现情况,对所述第一训练样本集中每个第一训练样本中所包含的至少一个标签进行排序处理,以获得所述每个第一训练样本的样本序列;
根据所述每个第一训练样本的样本序列,构建所述卷积神经网络。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据标签在第二训练样本集中的出现情况,对所述第二训练样本集中每个第二训练样本中所包含的至少一个标签进行排序处理,以获得所述每个第二训练样本的样本序列。
5.根据权利要求1所述的方法,其特征在于,所述根据所述后验概率,选择一个标签序列,包括:
根据所述后验概率,从所述资源的全部标签序列中,选择所述一个标签序列;或者
根据所述后验概率,从所述资源的部分标签序列中,选择所述一个标签序列。
6.根据权利要求1~5任一权利要求所述的方法,其特征在于,所述资源包括图像。
7.一种标签的处理装置,其特征在于,包括:
获取单元,用于获取资源的语义特征数据;
处理单元,用于根据所述资源的语义特征数据,获得所述资源的至少一个标签序列的后验概率;
选择单元,用于根据所述后验概率,选择一个标签序列,以作为所述资源的标签集合;其中,
所述处理单元,具体用于
根据所述资源的语义特征数据,利用预先构建的递归神经网络,获得所述资源的至少一个标签序列的后验概率;
所述处理单元,还用于
获得第二训练样本集中每个第二训练样本的样本序列;
获取所述第二训练样本集中每个第二训练样本中所包含的一个资源的语义特征数据;以及
根据所述每个第二训练样本的样本序列和所述每个第二训练样本中所包含的一个资源的语义特征数据,构建所述递归神经网络。
8.根据权利要求7所述的装置,其特征在于,所述获取单元,具体用于
利用预先构建的卷积神经网络,对所述资源进行处理,以获得所述资源的语义特征数据。
9.根据权利要求8所述的装置,其特征在于,所述获取单元,还用于
根据标签在第一训练样本集中的出现情况,对所述第一训练样本集中每个第一训练样本中所包含的至少一个标签进行排序处理,以获得所述每个第一训练样本的样本序列;以及
根据所述每个第一训练样本的样本序列,构建所述卷积神经网络。
10.根据权利要求8所述的装置,其特征在于,所述处理单元,还用于
根据标签在第二训练样本集中的出现情况,对所述第二训练样本集中每个第二训练样本中所包含的至少一个标签进行排序处理,以获得所述每个第二训练样本的样本序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510707963.X/1.html,转载请声明来源钻瓜专利网。