[发明专利]一种自适应架构语义分布文本理解方法及系统有效
申请号: | 202010661152.1 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111814468B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 庞文君;杨猛;黄志青 | 申请(专利权)人: | 前海企保科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/33;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市中科创为专利代理有限公司 44384 | 代理人: | 彭西洋;谢亮 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 架构 语义 分布 文本 理解 方法 系统 | ||
1.一种自适应架构语义分布文本理解方法,其特征在于,包括步骤:
通过文本基础编码器模块对输入文本进行编码,获得文本特征表示;
通过语义关联关键分布表示模块将所述文本特征表示进行多头注意力机制处理,形成所述文本特征表示的自注意力表示;
通过架构自适应分类网络模块对所述文本特征表示的自注意力表示进行自动选择分类网络,实现最后的分类;
所述语义关联关键分布表示模块包括上下文多头注意力语义分布表示和关键信息多头注意力语义分布表示;
所述上下文多头注意力语义分布表示具体算法如下:
其中,W1,W2,W3为线性矩阵,将h-2,h-1放缩到dk维,有:
dh是h-2,h-1的维度,k表示多头数量;
h-2,h-1表示提取BERT的最后2个隐藏层作为后续层级,设x=[x1,x2,…,xl],l为文本长度,则:
h-2,h-1=BERT(x)。
2.根据权利要求1所述的自适应架构语义分布文本理解方法,其特征在于,所述文本基础编码器模块采用BERT预训练语言模型进行编码。
3.根据权利要求1所述的自适应架构语义分布文本理解方法,其特征在于,所述关键信息多头注意力语义分布表示具体算法如下:
获取上下文注意力语义分布表示之后,进一步将输入文本的上下文注意力语义分布表示进行自注意力加权计算得分,计算每个词相对于分类任务的权重α:
W4T,b分别为自注意力加权网络的权重和偏置,取Top n个关键词的权重αt=[α0,α1,…,αn]和对应的网络表示进行加权操作:
则即是关键信息自注意力表示,
多头注意力就是将以上的头结构复制k份,每个头结构一致,可学习的权重参数不同,最后,拼接k个头,形成多头注意力结果表示hatt;
4.根据权利要求1或2所述的自适应架构语义分布文本理解方法,其特征在于,所述架构自适应分类网络模块根据分类类别的相近程度自适应的选择分类网络层,从而使相近的分类共用权重参数,分类类别相差较大的分类不共用权重,从而能更好的解决分类类别无法完全独立的问题。
5.根据权利要求4所述的自适应架构语义分布文本理解方法,其特征在于,所述架构自适应分类网络模块是树结构,每个节点都有一个分裂路径网络和一个共用编码器及全连接网络,其中叶子节点只有共用编码器及全连接网络。
6.根据权利要求5所述的自适应架构语义分布文本理解方法,其特征在于,所述分裂路径网络的分裂路径选择操作是一种MLP结构的自注意力机制,分裂路径选择网络会给出相近的权重,保留概率最大的那条路径,类别相近的分类共享同一路径的网络权重,进入同一分类器;对于分类类别相差较大的数据,网络提取的特征差别也较大,分裂路径选择网络倾向于给出不同的权重,选择不同的分裂路径。
7.一种自适应架构语义分布文本理解系统,其特征在于,包括:文本基础编码器模块、语义关联关键分布表示模块、架构自适应分类网络模块;
所述文本基础编码器模块对输入文本进行编码,获得文本特征表示;
所述语义关联关键分布表示模块将所述文本特征表示进行多头注意力机制处理,形成所述文本特征表示的自注意力表示;
所述架构自适应分类网络模块对所述文本特征表示的自注意力表示进行自动选择分类网络,实现最后的分类;
所述语义关联关键分布表示模块包括上下文多头注意力语义分布表示和关键信息多头注意力语义分布表示;
所述上下文多头注意力语义分布表示具体算法如下:
其中,W1,W2,W3为线性矩阵,将h-2,h-1放缩到dk维,有:
dh是h-2,h-1的维度,k表示多头数量;
h-2,h-1表示提取BERT的最后2个隐藏层作为后续层级,设x=[x1,x2,…,xl],l为文本长度,则:
h-2,h-1=BERT(x)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于前海企保科技(深圳)有限公司,未经前海企保科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010661152.1/1.html,转载请声明来源钻瓜专利网。