[发明专利]一种训练样本的处理方法、装置有效
申请号: | 201810862790.2 | 申请日: | 2018-08-01 |
公开(公告)号: | CN110796153B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 唐大怀;陈戈 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F18/24 | 分类号: | G06F18/24;G06F18/214 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;窦晓慧 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种训练样本的处理方法、装置,该方法包括如下步骤:获得第一数据样本;获取第一数据样本经第一分类器分类后获得的错误主题以及与错误主题相关的分类数据;根据与错误主题相关的分类数据,获取导致第一数据样本经第一分类器分类后获得错误主题的第一特征;从用于对第一分类器进行模型训练、且可训练出错误主题的训练样本中获得包含第一特征的训练样本;对包含第一特征的训练样本进行处理。通过使用本方法,可避免通过人工对已标注的训练样本进行筛选观察所造成的人力资源浪费;并且可高效查找出在模型训练过程中发生错误的训练样本,避免现有的无法对此类训练样本进行筛查所造成的对训练样本进行数据清洗的准确率低的问题。 | ||
搜索关键词: | 一种 训练 样本 处理 方法 装置 | ||
【主权项】:
1.一种训练样本的处理方法,其特征在于,包括:/n获得第一数据样本;/n获取所述第一数据样本经第一分类器分类后获得的错误主题以及与所述错误主题相关的分类数据;/n根据所述与所述错误主题相关的分类数据,获取所述第一数据样本包含的、导致所述第一数据样本经第一分类器分类后获得所述错误主题的第一特征;/n从用于对所述第一分类器进行模型训练、且可训练出所述错误主题的训练样本中获得包含所述第一特征的训练样本;/n对所述包含所述第一特征的训练样本进行处理。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810862790.2/,转载请声明来源钻瓜专利网。