[发明专利]一种保险产品需求文档处理方法、装置及电子设备在审
申请号: | 202010172659.0 | 申请日: | 2020-03-12 |
公开(公告)号: | CN111444718A | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 王宝松 | 申请(专利权)人: | 泰康保险集团股份有限公司;泰康在线财产保险股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/247;G06K9/62;G06Q40/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100031 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 保险产品 需求 文档 处理 方法 装置 电子设备 | ||
1.一种保险产品需求文档处理方法,其特征在于,所述方法包括:
获取待处理的目标保险产品需求文档;
将所述目标保险产品需求文档输入预先训练好的实体规则识别模型中,得到所述目标保险产品需求文档中的各个实体,以及各个实体对应的实体类型;
将所得到的各个实体,以及各个实体对应的实体类型进行结构化存储;
其中,所述实体规则识别模型是基于样本保险产品需求文档训练得到的,并且,在训练所述实体规则识别模型的过程中,标注所述样本保险产品需求文档中的训练集保险产品需求文档中的各个实体,以及各个实体对应的实体类型;
所述标注所述样本保险产品需求文档中的训练集保险产品需求文档中的各个实体,以及各个实体对应的实体类型,包括:
对所述样本保险产品需求文档中的训练集保险产品需求文档的文档内容进行分词,得到分词结果;在所述分词结果中,确定属于实体的目标分词;标注所述目标分词的实体类型,其中,属于同义词的目标分词被标注为相同的实体类型。
2.根据权利要求1所述的方法,其特征在于,训练所述实体规则识别模型的过程,还包括:
获取样本保险产品需求文档;
将所述样本保险产品需求文档分为训练集保险产品需求文档和测试集保险产品需求文档,所述训练集保险产品需求文档用于训练预定神经网络模型,所述测试集保险产品需求文档用于测试预定神经网络模型;
将标注各个实体以及各个实体对应的实体类型的训练集保险产品需求文档输入预定神经网络模型中,对所述预定神经网络模型进行训练,得到训练后的预定神经网络模型;
将所述测试集保险产品需求文档输入所述训练后的预定神经网络模型中,当从所述训练后的预定神经网络模型输出的实体以及实体类型的准确率大于预设准确率时,将所述训练后的预定神经网络模型确定为训练好的实体规则识别模型。
3.根据权利要求1所述的方法,其特征在于,所述保险产品需要文档包括:保险产品的购买规则和/或保险产品的核保规则。
4.根据权利要求3所述的方法,其特征在于,在所述保险产品需要文档包括保险产品的核保规则时,所述将所述目标保险产品需求文档输入预先训练好的实体规则识别模型中,得到所述目标保险产品需求文档中的各个实体,以及各个实体对应的实体类型,包括:
获取所述目标保险产品需求文档中,用于描述保险产品的核保规则的目标文档内容;
将所述目标文档内容输入预先训练好的实体规则识别模型中,得到所述目标文档内容中的各个目标实体,以及各个目标实体对应的目标实体类型。
5.根据权利要求4所述的方法,其特征在于,所述将所得到的各个实体,以及各个实体对应的实体类型进行结构化存储,包括:
将所得到的各个目标实体以及所述各个目标实体对应的目标实体类型,以结构化数据的形式存储于核保规则数据库中。
6.根据权利要求1至5任一项所述的方法,其特征在于,在所述标注所述目标分词的实体类型之前,所述方法还包括:
建立同义词字典,其中,所述同义词字典中将保险行业中属于相同实体的词语标注为同义词。
7.根据权利要求1至5任一项所述的方法,其特征在于,所述样本保险产品需求文档为保险产品人员已撰写的保险产品需求文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司;泰康在线财产保险股份有限公司,未经泰康保险集团股份有限公司;泰康在线财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010172659.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自动曝光控制方法、终端及计算机可读存储介质
- 下一篇:一种铜带加工工艺