[发明专利]文件标注方法及装置在审
申请号: | 201310206739.3 | 申请日: | 2013-05-29 |
公开(公告)号: | CN104216882A | 公开(公告)日: | 2014-12-17 |
发明(设计)人: | 邓志鸿;张杰;赖博彦 | 申请(专利权)人: | 华为技术有限公司;北京大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 唐华明 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 标注 方法 装置 | ||
1.一种文件标注方法,其特征在于,包括:
获取待标注文件;
根据所述待标注文件,获取所述待标注文件的特征向量;
根据所述待标注文件的特征向量以及所述待标注文件的特征向量与所述待标注文件的标签指示向量的转换关系,获得所述待标注文件的标签指示向量;
根据所述待标注文件的标签指示向量以及所述待标注文件的标签指示向量与所述待标注文件的分类指示向量的转换关系,获得所述待标注文件的分类指示向量;
根据所述待标注文件的标签指示向量和所述待标注文件的分类指示向量,标注所述待标注文件,其中包括:将所述待标注文件的标签指示向量和所述待标注文件的分类指示向量标注于所述待标注文件上,以实现通过所述标签指示向量和所述分类指示向量相结合的方式对所述待标注文件进行标注。
2.根据权利要求1所述的文件标注方法,其特征在于,在所述获得所述待标注文件的标签指示向量的步骤之前,还包括:
获取文件标注训练集中的训练文件;
根据所述训练文件,获取所述训练文件的特征向量、所述训练文件的标签指示向量和所述训练文件的分类指示向量;
根据所述训练文件的特征向量、所述训练文件的标签指示向量和所述训练文件的分类指示向量,获得所述训练文件的特征向量与所述训练文件的标签指示向量的转换关系和所述训练文件的标签指示向量与所述训练文件的分类指示向量的转换关系,以及将所述训练文件的特征向量与所述训练文件的标签指示向量的转换关系作为所述待标注文件的特征向量与所述待标注文件的标签指示向量的转换关系,将所述训练文件的标签指示向量与所述训练文件的分类指示向量的转换关系作为所述待标注文件的标签指示向量与所述待标注文件的分类指示向量的转换关系。
3.根据权利要求2所述的文件标注方法,其特征在于,所述获得所述训练文件的特征向量与所述训练文件的标签指示向量的转换关系和所述训练文件的标签指示向量与所述训练文件的分类指示向量的转换关系的步骤包括:
建立目标函数:min||W||+λ
根据所述目标函数,获得所述W和所述V,使得所述训练文件的特征向量与所述训练文件的标签指示向量的转换关系为Y=X*W,以及使得所述训练文件的标签指示向量与所述训练文件的分类指示向量的转换关系为T=Y*V
4.根据权利要求1至3任意一项所述的文件标注方法,其特征在于,所述标注所述待标注文件的步骤包括:
在所述待标注文件的标签指示向量中选择预定个数的分量作为所述待标注文件的标签标注结果,标注所述待标注文件,其中,被选择的分量的值大于未被选择的分量的值。
5.根据权利要求1至3任意一项所述的文件标注方法,其特征在于,所述标注所述待标注文件的步骤包括:
将所述待标注文件的分类指示向量中的最大值分量作为所述待标注文件的分类标注结果,标注所述待标注文件。
6.根据权利要求1至3任意一项所述的文件标注方法,其特征在于,所述待标注文件为图片文件、音频文件、视频文件或文本文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;北京大学,未经华为技术有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310206739.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种环形激光带除锈装置
- 下一篇:激光耦光焊接设备