[发明专利]基于元学习的目标分类方法、装置、设备和存储介质在审
申请号: | 202011523348.0 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112613555A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 刘玉;徐国强 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F16/951 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 袁武 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 目标 分类 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能领域,尤其是一种基于元学习的目标分类方法、装置、设备和存储介质。所述方法包括:获取新增数据,并根据所述新增数据构建参照样本;根据新增数据以及参照样本得到待分类目标;将所述参照样本和所述待分类目标输入至预先生成的目标分类模型中,以确定所述待分类目标属于所述参照样本所属分类的第一概率,其中,所述目标分类模型是基于元学习的方式训练得到的;根据所述第一概率确定所述待分类目标所属分类。采用本方法能够提高新增数据分类准确性。此外,本发明还涉及区块链技术,新增数据以及新增数据对应的分类可存储于区块链节点中。
技术领域
本申请涉及人工智能技术领域,特别是涉及一种基于元学习的目标分类方法、装置、设备和存储介质。
背景技术
随着人工智能技术的发展,出现了计算机视觉、自然语言处理、语音识别等技术,但不同的人对于庞大的人工智能领域各有研究侧重点,如计算机视觉领域中的子任务目前就已经达到了500多个,自然语言处理领域的子任务也有300多个。对于纷繁复杂的学术论文,人工智能领域的学者急需一套系统来对新出现的论文进行分类和打标签。
然而,传统的基于机器学习的论文分类模型都只能处理训练集中出现过的论文类别,一旦有新类别的论文过来,这些模型就无法对这些论文进行正确的分类。此外新类别的论文一开始数据较少,由于机器学习模型通常都需要大量的训练样本来进行训练,即时将新类别的论文作为训练数据来进行训练,也不可能得到一个准确率很高的分类模型,导致模型在测试集上的效果变差,进而导致新出现的论文的分类不准确。
发明内容
基于此,有必要针对上述技术问题,提供一种能够保证新增数据分类准确性的基于元学习的目标分类方法、装置、设备和存储介质。
一种基于元学习的目标分类方法,所述方法包括:
获取新增数据,并根据所述新增数据构建参照样本;
根据所述新增数据以及所述参照样本得到待分类目标;
将所述参照样本和所述待分类目标输入至预先生成的目标分类模型中,以确定所述待分类目标属于所述参照样本所属分类的第一概率,其中,所述目标分类模型是基于元学习的方式训练得到的;
根据所述第一概率确定所述待分类目标所属分类。
在其中一个实施例中,所述新增数据包括多个分类;所述根据所述新增数据构建参照样本包括:
将所述新增数据按照分类进行分组,并构建每一分组对应的参照样本;
所述将所述参照样本和所述待分类目标输入至预先生成的目标分类模型中,以确定所述待分类目标属于所述参照样本所属分类的第一概率,包括:
将所述参照样本和所述待分类目标输入至预先生成的目标分类模型中,以确定所述待分类目标属于每个分类的第一概率。
在其中一个实施例中,所述目标分类模型的训练方式包括:
获取样本数据,根据所述样本数据构建多组元训练样本;
根据所述元训练样本进行训练得到目标分类模型。
在其中一个实施例中,所述根据所述元训练样本进行训练得到目标分类模型,包括:
对每一组元训练样本的每个支撑样本和查询样本的单词进行序列化;
将序列化后的每个单词进行高阶特征处理得到对应的高阶特征表示;
对所述高阶特征表示进行平均池化操作以得到每个支撑样本对应的向量表示以及每个查询样本对应的向量表示;
根据所述每个支撑样本对应的向量表示以及每个查询样本对应的向量表示进行训练得到目标分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011523348.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于盾构隧道砼结构附件浇筑的自驱模板
- 下一篇:一种低熔渣率金属熔炼装置