[发明专利]保险领域三元组抽取方法、装置、电子设备及存储介质有效
申请号: | 202210875618.7 | 申请日: | 2022-07-25 |
公开(公告)号: | CN115204120B | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 杨坤;王燕蒙;李剑锋;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/126;G06F40/284;G06F16/35;G06N3/0442 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 保险 领域 三元 抽取 方法 装置 电子设备 存储 介质 | ||
1.一种保险领域三元组抽取方法,其特征在于,所述方法包括:
获取保险目标文本,利用预设的Bert模型中的编码模块对所述保险目标文本进行编码,得到文本向量及文本向量位置编码;
利用预设第一自注意力机制,对所述文本向量加入对应权重,得到第一权重文本向量;
基于所述第一权重文本向量,利用预设的第一半指针半标注预测模型,预测所述保险目标文本中第一实体的首尾位置;
根据所述第一实体的首尾位置、所述文本向量及所述文本向量位置编码,查找第一实体文本向量及第一实体文本向量位置编码;
利用预设双向长短时记忆网络对所述第一实体文本向量编码,得到第一实体编码向量,并将所述第一实体编码向量与所述第一实体文本向量位置编码进行拼接,得到第一拼接向量;
利用预设第二自注意力机制,对所述文本向量加入对应权重,得到第二权重文本向量,拼接所述第二权重文本向量及所述第一拼接向量,得到第二拼接向量;
根据所述第二拼接向量,利用预设的第二半指针半标注预测模型预测所述第一实体对应的关系及第二实体;
当所述第一实体、所述第一实体对应的关系及所述第二实体能够形成一个闭环时,根据所述第一实体、所述第一实体对应的关系及所述第二实体,生成所述保险目标文本的三元组;
其中,所述利用预设的Bert模型中的编码模块对所述保险目标文本进行编码,得到文本向量及文本向量位置编码,包括:提取所述保险目标文本的文本特征,并对所述文本特征进行字词混合编码,得到字词向量序列;对所述保险目标文本中的每一个文字进行位置索引编码,得到文本向量位置编码;将所述字向量序列与所述文本向量位置编码进行相加,得到文本拼接向量,并利用预设的Bert模型中的编码模块对所述文本拼接向量进行编码,得到文本向量;
所述基于所述第一权重文本向量,利用预设的第一半指针半标注预测模型,预测所述保险目标文本中第一实体的首尾位置,包括:利用预设的第一半指针半标注预测模型中的开始指针及结束指针筛选出第一待选实体的首尾位置;根据所述第一待选实体的首尾位置,对所述第一待选实体进行位置编码,得到第一待选实体位置编码向量;将所述第一待选实体位置编码向量与所述第一权重文本向量进行点乘,得到第一加权求和向量;从所述第一加权求和向量中筛选出大于第一预设数值的第一目标加权求和向量,并将所述第一目标加权求和向量对应的第一待选实体的首尾位置作为第一实体的首尾位置;
所述根据所述第二拼接向量,利用预设的第二半指针半标注预测模型预测所述第一实体对应的关系及第二实体,包括:利用预设的第二半指针半标注预测模型中的开始指针及结束指针从所述第一实体中筛选出第二待选实体的首尾位置;根据所述第二待选实体的首尾位置,对所述第二待选实体进行位置编码,得到第二待选实体位置编码向量;将所述第二待选实体位置编码向量与所述第二权重文本向量进行点乘,得到第二加权求和向量;从所述第二加权求和向量中筛选出大于第二预设数值的第二目标加权求和向量,并将所述第二目标加权求和向量对应的第二待选实体的首尾位置作为第二实体的首尾位置;根据所述第二实体的首尾位置,查询所述保险目标文本,得到第二实体;根据预设的实体类别对照表,对所述第二实体进行实体分类,得到第二实体类别;根据预先确定的第一实体类别及所述第二实体类别,预测所述第一实体对应的关系;
所述利用预设双向长短时记忆网络对所述第一实体文本向量编码,得到第一实体编码向量,包括:获取所述第一实体文本向量的数量,并选取与所述第一实体文本向量的数量相同的预设双向长短时记忆单元,并拼接所有所述预设双向长短时记忆单元,得到目标双向长短时记忆网络;利用所述目标双向长短时记忆网络中的嵌入层对所述第一实体文本向量进行降维,得到第一实体文本降维向量;将所述第一实体文本降维向量分别输入每一层所述目标双向长短时记忆网络中的网络层正向和反向的一个长短时记忆网络单元,并利用所述目标双向长短时记忆网络中的连接层将所述网络层正向和反向的长短时记忆网络单元的输出结果进行拼接,得到第一实体编码向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210875618.7/1.html,转载请声明来源钻瓜专利网。