[发明专利]一种智能处理保险条款的方法在审
申请号: | 202010698353.9 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111833198A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 卫波 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06Q10/10;G06F16/21;G06F16/22;G06F16/951 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 处理 保险条款 方法 | ||
1.一种智能处理保险条款的方法,其特征在于,所述方法通过定期对各网站上的保险条款进行爬虫抓取和人工下载来收集保险条款,对收集到的保险条款进行处理,提取关键信息并按预定形式保存进数据库,再以数据库为基础搭建线上服务系统供使用人员查询调用;
提取的关键信息包括关键词、大标题、小标题和专项内容。
2.根据权利要求1所述的智能处理保险条款的方法,其特征在于,所述方法的步骤包括:
S1、保险条款的收集:定期对各保险公司网站进行爬虫抓取获得保险条款,并对禁止爬虫抓取的网站采用人工下载的方式获得保险条款;
S2、对获取的保险条款进行处理,提取条款内容和关键信息存入数据库相应位置;
S3、采用DOCKER+GUNICORN+FLASH的方式搭建线上服务系统供使用人员对保险条款查询调用。
3.根据权利要求1所述的智能处理保险条款的方法,其特征在于,数据库采用MYSQL数据库;MYSQL数据库包括USER表、条款原始数据表和关键信息表。
4.根据权利要求1所述的智能处理保险条款的方法,其特征在于,关键词具体为数字日期类词段。
5.根据权利要求2所述的智能处理保险条款的方法,其特征在于,步骤S1的具体内容包括:定期运行python爬虫脚本对各保险公司网站进行爬取,获取新保险条款,并将新保险条款与已获取保险条款对比,若对比结果有新增保险条款,则针对新增保险条款进入S2。
6.根据权利要求5所述的智能处理保险条款的方法,其特征在于,步骤S1的具体内容还包括:定期对禁止爬虫抓取的网站人工下载获得新保险条款,将新保险条款与已获取保险条款对比,若对比结果有新增保险条款,则针对新增保险条款进入S2。
7.根据权利要求2所述的智能处理保险条款的方法,其特征在于,步骤S2中先根据格式对保险条款文件进行分类,针对不同格式的文件分别进行关键信息和条款内容的提取。
8.根据权利要求7所述的智能处理保险条款的方法,其特征在于,针对word格式的保险条款文件,采用python脚本进行条款内容和关键信息的提取。
9.根据权利要求7所述的智能处理保险条款的方法,其特征在于,针对pdf格式的保险条款文件,采用OCR识别算法进行条款内容和关键信息的提取。
10.一种存储介质,用于存储程序,其中所述程序在被执行时使得设备实现如权利要求1-9任一所述的内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010698353.9/1.html,转载请声明来源钻瓜专利网。