[发明专利]神经网络训练方法、文本分类方法及文本分类系统在审

申请号：	202210676061.4	申请日：	2022-06-15
公开（公告）号：	CN115080737A	公开（公告）日：	2022-09-20
发明（设计）人：	曾祥云;朱姬渊	申请（专利权）人：	上海易康源医疗健康科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06N3/04;G06N3/08
代理公司：	上海硕力知识产权代理事务所(普通合伙) 31251	代理人：	杨用玲
地址：	200120 上海市浦东新区中国(上***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络训练方法文本分类系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种神经网络训练方法、文本分类方法及文本分类系统。神经网络训练方法包括：S1:准备数据集：源域文本和目标域文本；S2:将源数据输入到源域神经网络中，提取源文本的特征；S3:对源文本的特征进行分类，得到源域分类标签；S4:根据源文本以及源域分类标签和目标文本进行训练，得到目标域的分类标签。本申请得到神经网络在应用如文本分类，达到了又快又准的技术效果。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种神经网络训练方法、文本分类方法及文本分类系统。

背景技术

自从2017年Transformer模型诞生以来，encoder-decoder取得的技术效果非常显著，然后2018年Google又提出了BERT预训练模型，又大大推动了NLP的的进步，广泛应用在NLP的各个领域里，比如对文本分类。

但基于bert模型也存在其难以解决的技术缺陷，主要是因为基于bert模型的文本分类算法构建的模型，参数都非常大，导致训练成本非常高，在实际使用的时候速度也比较慢，同时对于新出现的文本分类也不够准确。

发明内容

本发明为解决现有技术中存在的技术问题，提出一种神经网络训练方法，包括步骤：

S1:准备数据集：源域文本和目标域文本；

S2:将源数据输入到源域神经网络中，提取源文本的特征；

S3:对源文本的特征进行分类，得到源域分类标签；

S4:根据源文本以及源域分类标签和目标文本进行训练，得到目标域的分类标签。

进一步地，步骤S4:根据源文本以及源域分类标签和目标文本进行训练，得到目标域的分类标签包括：