[发明专利]一种智能处理保险条款的方法在审
申请号: | 202010698353.9 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111833198A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 卫波 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06Q10/10;G06F16/21;G06F16/22;G06F16/951 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 处理 保险条款 方法 | ||
本发明提供了一种智能处理保险条款的方法,涉及网络数据处理技术领域,能够整合市面上的各类条款,智能提取条款内容和关键信息,构建供使用者调取使用的服务系统,节省使用者查询时间,提高使用效率;该方法通过定期对各网站上保险条款的爬取来收集保险条款,对收集到的保险条款进行处理,提取关键信息并按预定形式保存进数据库,再搭建线上服务系统供使用人员查询调用。本发明提供的技术方案适用于网络保险数据整合的过程中。
【技术领域】
本发明涉及网络数据处理技术领域,尤其涉及一种智能处理保险条款的方法。
【背景技术】
目前保险条款种类众多,各个公司也均不相同,使用时光在网上检索保险条款就消耗极大的时间和精力,造成极大的不便。又由于很多条款内容很长,无法快速的获取其要义,通常需要将条款完整阅读后才能后知晓是否为自己需要的保险条款,检索量大时阅读条款的时间也是相当可观的,造成检索效率低,用户体验感差的后果。
因此,有必要研究一种智能处理保险条款的方法来应对现有技术的不足,以解决或减轻上述一个或多个问题。
【发明内容】
有鉴于此,本发明提供了一种智能处理保险条款的方法,整合市面上的各类条款,智能提取条款内容和关键信息,构建供使用者调取使用的服务系统。
一方面,本发明提供一种智能处理保险条款的方法,其特征在于,所述方法通过定期对各网站上保险条款的爬取来收集保险条款,对收集到的保险条款进行处理,提取关键信息并按预定形式保存进数据库,再搭建线上服务系统供使用人员查询调用。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述方法的步骤包括:
S1、保险条款的收集:定期对各保险公司网站进行爬虫抓取获得保险条款,并对禁止爬虫抓取的网站采用人工下载的方式获得保险条款;
S2、对获取的保险条款进行处理,提取关键信息和条款内容存入数据库中,并生成csv文件;
S3、采用DOCKER+GUNICORN+FLASH的方式搭建线上服务系统。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤S2中提取的关键信息包括关键词、大标题、小标题和专项内容。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,数据库采用MYSQL数据库;MYSQL数据库包括USER表、条款原始数据表和关键信息表。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,关键词具体为数字日期类词段。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤S1的具体内容包括:定期运行python爬虫脚本对各保险公司网站进行爬取,获取新保险条款,并将新保险条款与已获取保险条款对比,若对比结果有新增保险条款,则针对新增保险条款进入S2。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤S1的具体内容还包括:定期对禁止爬虫抓取的网站人工下载获得新保险条款,将新保险条款与已获取保险条款对比,若对比结果有新增保险条款,则针对新增保险条款进入S2。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,步骤S2中先根据格式对保险条款文件进行分类,针对不同格式的文件分别进行关键信息和条款内容的提取。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,针对word格式的保险条款文件,采用python脚本进行条款内容和关键信息的提取。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,针对pdf格式的保险条款文件,采用OCR识别算法进行条款内容和关键信息的提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010698353.9/2.html,转载请声明来源钻瓜专利网。