[发明专利]依存关系分类方法及相关设备有效
申请号: | 202010753501.2 | 申请日: | 2020-07-30 |
公开(公告)号: | CN112036439B | 公开(公告)日: | 2023-09-01 |
发明(设计)人: | 马旭强;郝正鸿;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06N3/0464;G06N3/045;G06N3/0442;G06N3/084 |
代理公司: | 深圳市赛恩倍吉知识产权代理有限公司 44334 | 代理人: | 陈敬华 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 依存 关系 分类 方法 相关 设备 | ||
1.一种依存关系分类方法,其特征在于,所述依存关系分类方法包括:
获取语句样本、目标语句和分类模型,所述分类模型包括BERT层、字编码层、分词层、词编码层、感知层和仿射分类层;
通过所述BERT层生成所述语句样本的第一字向量序列;
通过所述分词层对所述语句样本进行分词,得到所述语句样本的多个词语样本;
通过所述字编码层对所述语句样本进行编码,得到所述语句样本的第二字向量序列和第三字向量序列;
通过所述词编码层根据所述语句样本的第一字向量序列、第二字向量序列、第三字向量序列计算所述多个词语样本的词向量;
通过所述感知层根据所述多个词语样本的词向量确定所述多个词语样本的核心词向量和依存词向量;
通过所述仿射分类层根据任意两个词语样本的核心词向量和依存词向量对所述任意两个词语样本的依存关系进行分类;
根据所述任意两个词语样本的依存关系分类结果和所述任意两个词语样本在所述语句样本中的依存关系标签对所述分类模型进行训练,得到训练后的分类模型;
通过所述训练后的分类模型对所述目标语句进行词语依存关系分类。
2.如权利要求1所述的依存关系分类方法,其特征在于,所述通过所述字编码层对所述语句样本进行编码包括:
对于所述语句样本中的每个字样本,获取所述字样本的位置信息和类型信息;
通过所述字编码层的第一字编码子层对所述字样本的位置信息进行编码,得到所述字样本的第二字向量;
依字序组合所述语句样本中的多个字样本的第二字向量,得到所述语句样本第二字向量序列;
通过所述字编码层的第二字编码子层对所述字样本的类型信息进行编码,得到所述字样本的第三字向量;
依字序组合所述语句样本中的多个字样本的第三字向量,得到所述语句样本第三字向量序列。
3.如权利要求1所述的依存关系分类方法,其特征在于,所述通过所述词编码层根据所述语句样本的第一字向量序列、第二字向量序列、第三字向量序列计算所述多个词语样本的词向量包括:
对于所述多个词语样本中的每个词语样本,确定组成所述词语样本的多个目标字样本;
对于每个目标字样本,根据所述目标字样本的第一字向量、第二字向量、第三字向量生成所述目标字样本的特征向量;
根据所述多个目标字样本的特征向量计算所述词语样本的词向量。
4.如权利要求3所述的依存关系分类方法,其特征在于,所述根据所述目标字样本的第一字向量、第二字向量、第三字向量生成所述目标字样本的特征向量包括:
连接所述目标字样本的第一字向量、第二字向量、第三字向量,得到所述目标字样本的特征向量;或
计算所述目标字样本的第一字向量、第二字向量和第三字向量的第一均值向量,将所述第一均值向量确定为所述目标字样本的特征向量。
5.如权利要求3所述的依存关系分类方法,其特征在于,所述根据所述多个目标字样本的特征向量计算所述词语样本的词向量包括:
计算所述多个目标字样本的特征向量的第二均值向量,将所述第二均值向量确定为所述目标字样本的特征向量。
6.如权利要求1所述的依存关系分类方法,其特征在于,所述根据所述任意两个词语样本的依存关系分类结果和所述任意两个词语样本在所述语句样本中的依存关系标签对所述分类模型进行训练包括:
根据所述语句样本中的依存关系标签确定多个标签权重;
基于交叉熵损失算法根据所述任意两个词语样本的依存关系分类结果,所述任意两个词语样本在所述语句样本中的依存关系标签和所述多个标签权重计算损失值;
基于反向传播算法根据所述损失值对所述分类模型中的参数进行优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010753501.2/1.html,转载请声明来源钻瓜专利网。