[发明专利]基于迭代网络组合的情感分类持续学习方法及存储介质在审
申请号: | 202110853228.5 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113590748A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 汪书鹏;刘俊浩;杨敏;姜青山 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京维正专利代理有限公司 11508 | 代理人: | 任志龙 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 网络 组合 情感 分类 持续 学习方法 存储 介质 | ||
1.一种基于迭代网络组合的情感分类持续学习方法,其特征在于,包括以下步骤:
将来自于多个数据源的训练数据以BERT为网络模型,建立原始网络;当获取到需要进行文本信息情感分类的新任务时;
以BERT为网络模型,将原始网络适应新任务,得到微调网络;
获取原始网络中的原始组合参数,并训练微调网络获取微调组合参数;
冻结原始组合参数和微调组合参数;
线性组合原始网络和微调网络,得到中间网络;
对中间网络进行权重组合参数的初始化,获得组合初始化参数;
获取中间网络中的原始组合参数和微调组合参数;
基于原始组合参数、微调组合参数和组合初始化参数重训练中间网络,得到优化权重组合参数;
将中间网络等价转换为最终组合网络,该最终组合网络在学习下一个新任务时作为新的原始网络;该优化权重组合参数作为下一个新任务原始网络的原始组合参数。
2.根据权利要求1所述的基于迭代网络组合的情感分类持续学习方法,其特征在于,步骤线性组合原始网络和微调网络中,通过结构线性组合中的残差运算来连接原始网络和微调网络,结构组合线性变换LTsc的变换式为:
LTsc(x)=LTo(x)+αo⊙LTo(x)+αf⊙LTf(x)
=Wox+αo⊙(Wox)+αf⊙(Wfx);
通过线性组合原始网络和微调网络得到中间网络,得到的中间网络包括原始网络线性变换权重参数αo和微调网络线性变换权重参数αf,原始网络线性变换权重参数αo和微调网络线性变换权重参数αf组合得到线性变换的中间网络参数(αo,αf);
其中,输入特性为LTo和LTf分别为原始网络和微调网络的线性变换的输出式;⊙表示元素级别的乘积;dj表示线性变换的输出维数,di表示线性变换的输入维数;Wo表示线性变换LTo权重参数,Wf表示线性变换LTf权重参数,αo,αf为权重组合参数,
3.根据权利要求2所述的基于迭代网络组合的情感分类持续学习方法,其特征在于,在步骤线性组合原始网络和微调网络中,通过结构组合层归一化中的均值和方差运算来连接原始网络和微调网络,其结构组合层归一化LNsc转换式为:
通过层归一化组合原始网络和微调网络得到中间网络;层归一化组合得到的中间网络包括原始网络层归一化权重参数βo和微调网络线层归一化重参数βf,层归一化权重参数βo和微调网络线层归一化重参数βf组合为层归一化后的中间网络参数(βo,βf);
其中,LNo为在原始网络的层归一化运算;LNf表示在微调网络的层归一化运算;go是原始网络中层归一化仿射变换的可学习参数,gf是微调网络中层归一化仿射变换的可学习参数,μ是输入隐藏表示x的平均值,σ是输入隐藏表示x的标准偏差,βo,βf为权重组合参数,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110853228.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种益智训练装置
- 下一篇:创伤外科术后康复辅助装置