[发明专利]一种基于文本语义处理的保险核保方法和装置在审
申请号: | 202010306058.4 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111652737A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 杨喆;徐铮;田立文;裴晋 | 申请(专利权)人: | 世纪保众(北京)网络科技有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06F16/36;G06F16/33 |
代理公司: | 北京金蓄专利代理有限公司 11544 | 代理人: | 姚金良 |
地址: | 102600 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 文本 语义 处理 保险 方法 装置 | ||
1.一种基于文本语义处理的保险核保方法,其特征在于包括:
第一步骤:建立基于保险核保相关的知识库;
第二步骤:接收用户输入的疾病名称;
第三步骤:根据相关表知识库中的同义词关系,匹配出输入的疾病名称的所有同义疾病;
第四步骤:根据相关表知识库中的包含关系,匹配出输入的疾病名称的所有子疾病及相应的同义词;
第五步骤:根据相关表知识库中的包含关系,匹配出疾病名称的所有父疾病及相应的同义词;
第六步骤:针对子疾病,根据相关表知识库中的包含关系,匹配出子疾病的所有子疾病及相应的同义词;
第七步骤:针对父疾病,根据相关表知识库中的包含关系,匹配出父疾病的所有父疾病及相应的同义词;
第八步骤:根据第三步骤得到的所有同义疾病的疾病名称,依据险种不可投保疾病知识库,匹配出不可投保的险种名称;
第九步骤:根据第四步骤和第六步骤得到的所有疾病名称,依据险种不可投保疾病知识库,匹配出疑似可投的险种名称;
第十步骤:根据第五步骤和第七步骤得到的所有疾病名称,依据险种不可投保疾病知识库,匹配出不可投保的险种名称;
第十一步骤:将第八步骤、第九步骤、第十步骤的结果中的重复险种,则按照过滤规则进行过滤,最终确定不可投保险种和疑似可投险种;
第十二步骤:根据最终确定的不可投保险种和疑似可投险种,将险种库中所有剩余险种确定可投保险种。
2.根据权利要求1所述的基于文本语义处理的保险核保方法,其特征在于,该基于保险核保相关的知识库包括:
病症库,其中以关联方式存储了疾病名称、疾病解释和核保结论;
险种不可投保疾病知识库,其中以关联方式存储了险种识别码和不可投保疾病名称;
相关表知识库,其中以关联方式存储了疾病名称的同义词关系,而且存储了疾病名称之间的包含关系;
健康告知富文本知识库,其中以关联方式存储了险种识别码和健康告知富文本格式;
健康告知高亮表,其中以关联方式存储了疾病名称和健康告知文本内容。
3.根据权利要求1或2所述的基于文本语义处理的保险核保方法,其特征在于,在第二步骤,采用自然语言处理模型Jaro-Winkler score对用户输入的疾病名称进行文本相似度衡量,将Jaro-Winkler score大于预定阈值(例如0.6)的文本确定为相似文本。
4.根据权利要求1或2所述的基于文本语义处理的保险核保方法,其特征在于还包括:基于用户输入的疾病名称,输出疾病解释和重疾险、医疗险及寿险核保结论。
5.根据权利要求1或2所述的基于文本语义处理的保险核保方法,其特征在于还包括:
提取第三步骤至第七步骤得到的疾病名称,结合健康告知高亮表,匹配出可能存在的健康告知文本内容;
针对第八步骤、第九步骤和第十步骤得到的险种,结合健康告知富文本知识库,匹配出每个险种的健康告知富文本;
对健康告知文本内容和健康告知富文本进行匹配,得到健康告知文本。
6.根据权利要求1或2所述的基于文本语义处理的保险核保方法,其特征在于,在每个险种的健康告知中,高亮显示不可投保相关的文本内容。
7.一种基于文本语义处理的保险核保装置,其特征在于用于实现根据权利要求1至6之一所述的基于文本语义处理的保险核保方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于世纪保众(北京)网络科技有限公司,未经世纪保众(北京)网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010306058.4/1.html,转载请声明来源钻瓜专利网。