[发明专利]基于领域适应的自然语言处理任务的迁移学习系统和方法有效
申请号: | 201710877941.7 | 申请日: | 2017-09-26 |
公开(公告)号: | CN107657313B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 肖仰华;谢晨昊;梁家卿;崔万云 | 申请(专利权)人: | 上海数眼科技发展有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 苏州国诚专利代理有限公司 32293 | 代理人: | 韩凤 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 领域 适应 自然语言 处理 任务 迁移 学习 系统 方法 | ||
1.基于领域适应的自然语言处理任务的迁移学习系统,包括:
开放领域部分模块和特定领域部分模块,其中,开放领域部分模块,用于:
利用已有的开放领域数据进行训练,根据不同自然语言处理任务修改输出层,具体包括:LSTM网络对开放领域进行训练,可以获得开放领域神经网络的权重矩阵;
特定领域部分模块,用于:构造特定领域神经网络,根据不同自然语言处理任务修改输出层,与开放领域部分输出层一致;
其中,保持重复部分神经网络权重矩阵与已经训练好的开放领域神经网络权重矩阵相同,训练特定领域神经网络,根据输出层结果得到不同自然语言处理任务的结果;
所述特定领域神经网络,具体包括:
开放领域部分模块的embedding层,LSTM层和独立的embedding层、LSTM层和输出层;
特定领域部分的LSTM层同时从开放领域部分embedding层和特定领域部分embedding层接收输入;
ct=it⊙ut+ft⊙ct-1
其中,xt是通过横向连接输入两个域的组合,it是第t个单元的输入门;ft是第t个单元的遗忘门;ot是第t个单元的输出门,W()、b()、U()是可训练参数,ct是第t单元的存储单元状态;
输出层同时接收开放领域部分LSTM层的输出和特定领域部分LSTM层的输出,进行输出;
其中,f是激活函数;输出层和开放领域部分输出层一致,对于不同的自然语言处理任务是可变的。
2.根据权利要求1所述的基于领域适应的自然语言处理任务的迁移学习系统,其特征在于,所述开放领域神经网络,包括embedding层,LSTM层和输出层,其中,Embedding层将句子中的词embedding为d维向量,LSTM层接收词embedding;
ct=it⊙ut+ft⊙ct-1
其中,it是第t个单元的输入门;ft是第t个单元的遗忘门;ot是第t个单元的输出门,W()、b()、U()为可训练参数,ct是第t单元的存储单元状态;
此外,输出层对于不同的自然语言处理任务是可变的。
3.根据权利要求1所述的基于领域适应的自然语言处理任务的迁移学习系统,其特征在于,当为情感分析任务时,输出层输出一个感情得分;
这里SO、SS分别为开放领域部分和特定领域部分输出层的输出,σ是sigmoid函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数眼科技发展有限公司,未经上海数眼科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710877941.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种导电极杠
- 下一篇:一种基于区间算法的神经网络卷积层设计方法