[发明专利]获取多标签的方法及装置有效
申请号: | 201310712889.1 | 申请日: | 2013-12-20 |
公开(公告)号: | CN103699628B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 石磊 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京品源专利代理有限公司11332 | 代理人: | 胡彬 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种获取多标签的方法及装置,方法包括获取至少两个包括属性和标签的样本,形成训练样本集合;从所述训练样本集合中筛选出与待评测样本的属性相关的预设数目的样本,形成所述待评测样本的邻近样本集合;分别获取各标签在所述邻近样本集合所包括的样本中的出现次数;分别计算所述待评测样本在带有或不带有各标签的条件下,所述邻近样本集合所包括的样本在各标签上的多项分布概率;根据所述多项分布概率和所述出现次数,按照预设算法计算所述待评测样本在各标签的概率,将概率大于预设概率阈值的标签作为所述待评测样本的标签。本发明能准确获取待评测样本的一个或一个以上的标签。 | ||
搜索关键词: | 获取 标签 方法 装置 | ||
【主权项】:
一种获取多标签的方法,其特征在于,包括:获取至少两个包括属性和标签的样本,形成训练样本集合;从所述训练样本集合中筛选出与待评测样本的属性相关的预设数目的样本,形成所述待评测样本的邻近样本集合;分别获取标签在所述邻近样本集合所包括的样本中的出现次数;分别计算所述待评测样本在带有标签的条件下,所述邻近样本集合所包括的样本在各标签上的多项分布概率,分别计算所述待评测样本在不带有标签的条件下,所述邻近样本集合所包括的样本在各标签上的多项分布概率;根据所述多项分布概率和所述出现次数,按照预设算法计算所述待评测样本在各标签的概率,将概率大于预设概率阈值的标签作为所述待评测样本的标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310712889.1/,转载请声明来源钻瓜专利网。
- 上一篇:温度探测装置
- 下一篇:一种多轴分组转向装置及多轴车辆