[发明专利]多任务分类模型训练方法、多任务分类方法及装置在审

专利信息
申请号: 201910839054.X 申请日: 2019-09-05
公开(公告)号: CN110728298A 公开(公告)日: 2020-01-24
发明(设计)人: 任磊;步佳昊;杨扬;王金刚;张富峥;王仲远 申请(专利权)人: 北京三快在线科技有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 11319 北京润泽恒知识产权代理有限公司 代理人: 任亚娟
地址: 100083 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 任务分类 预设信息 信息单元 标注 语义 训练模型 训练数据 预测结果 向量 调用参数 分类处理 模型训练 全局向量 分类器 共享层 分类 预设 调用 全局
【说明书】:

本公开提供了一种多任务分类模型训练方法、多任务分类方法及装置。所述方法包括:将预设信息输入至预训练模型;预设信息包括多个信息单元;调用参数共享层,对每个信息单元进行全局向量表征处理,确定每个信息单元的全局语义表征向量;调用多个分类器,根据每个全局语义表征向量对预设信息进行分类处理,确定预设信息的分类预测结果;基于分类预测结果、第一数量、第二数量和标注结果,计算得到损失值;在损失值处于预设范围内的情况下,将训练得到的目标预训练模型作为多任务分类模型。本公开可以在少量训练数据的基础上获取较好的多任务分类模型,在有新增任务的情况下,仅需增加少量的标注训练数据,能够降低标注成本。

技术领域

本公开的实施例涉及多任务分类模型训练技术领域,尤其涉及一种多任务分类模型训练方法、多任务分类方法及装置。

背景技术

随着电子商务的快速发展,越来越多的消费者在互联网平台上发表产品评论。面对用户更加直接的反馈,如何整合反馈信息,并对此做出迅速的反应,成为了企业的一大挑战。例如,以餐馆为例,用户评论文本中可能包含对商户服务、饭菜口味和价格水平等多个维度的评价内容。在先技术方案中,通常是采用自然语言处理技术从用户评论文本中挖掘出用户对商家各个维度的情感倾向,对如美团点评等O2O(Online to Offline,O2O电子商务)平台有着重要业务价值,既可以向商家反馈其优点和不足,优化经营策略,又可以向用户展示商家多维度信息,辅助用户做出决策。

传统的细粒度情感分析任务中,除了基于规则和情感词典的方法,还包括传统的机器学习方法:如支持向量机(SVM)、朴素贝叶斯分类器等;也有基于文本表征的深度学习方法:如DNN,长短时记忆网络(LSTM)、卷积神经网络(CNN)、Memory Network等。

采用上述方式,严重依赖于标注数据,尤其深度学习模型,需要大量的标注数据进行训练,标注成本较高。

发明内容

本公开实施例提供一种多任务分类模型训练方法、多任务分类方法及装置,用以在少量训练数据的基础上获取较好的多任务分类模型,而且,可以针对多个任务进行模型训练,在有新增任务的情况下,仅需在新增任务上增加很少的标注训练数据,即可够达到较好的模型效果,能够大幅度降低标注成本。

根据本公开实施例的第一方面,提供了一种多任务分类模型训练方法,包括:

将预设信息输入至预训练模型;所述预设信息包括多个信息单元,所述预训练模型包括参数共享层和多个分类器;

调用所述参数共享层,对每个所述信息单元进行全局向量表征处理,确定每个所述信息单元在所述预设信息中的全局语义表征向量;

调用所述多个分类器,根据每个所述全局语义表征向量对所述预设信息进行分类处理,确定所述预设信息在多个任务上的分类预测结果;

基于所述分类预测结果、所述预设信息在各所述任务上的第一数量、所述任务的第二数量和所述预设信息的标注结果,计算得到损失值;

在所述损失值处于预设范围内的情况下,将训练得到的目标预训练模型作为多任务分类模型。

在本公开的一种具体实现中,所述参数共享层包括嵌入层、双向网络结构编码器和表征结果输出层;

所述调用所述参数共享层,对每个所述信息单元进行全局向量表征处理,确定每个所述信息单元在所述预设信息中的全局语义表征向量,包括:

调用所述嵌入层,对每个所述信息单元进行信息单元向量表征处理,计算得到每个所述信息单元对应的信息单元语义表征向量;

调用所述双向网络结构编码器,对每个所述信息单元语义表征向量进行语义识别处理,计算得到每个信息单元语义表征向量在所述预设信息中的全局语义表征向量;

调用所述表征结果输出层输出所述全局语义表征向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910839054.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top