[发明专利]OCR模型训练方法、保险智能理赔方法及终端设备在审

专利信息
申请号: 202310096311.1 申请日: 2023-01-18
公开(公告)号: CN116168399A 公开(公告)日: 2023-05-26
发明(设计)人: 李晟;郭振华 申请(专利权)人: 阿里巴巴(中国)有限公司
主分类号: G06V30/19 分类号: G06V30/19;G06V10/764;G06V10/82;G06Q40/08;G06N3/044;G06N3/0464;G06N3/08
代理公司: 北京天同知创知识产权代理事务所(普通合伙) 16046 代理人: 张岳峰
地址: 310023 浙江省杭州市余杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: ocr 模型 训练 方法 保险 智能 理赔 终端设备
【权利要求书】:

1.一种OCR模型训练方法,包括:

获取清晰文本图像和真实模糊文本图像;

从所述真实模糊文本图像中提取模糊核;

根据所述清晰文本图像和所述模糊核,生成仿真模糊文本图像;

至少采用多个标记有文字内容信息和文字位置信息的所述仿真模糊文本图像,对OCR模型进行训练。

2.根据权利要求1所述的OCR模型训练方法,其中,所述根据所述清晰文本图像和所述模糊核,生成仿真模糊文本图像,包括:

对标记有所述文字内容信息和所述文字位置信息的所述清晰文本图像和所述模糊核进行卷积运算,得到第一中间图像;

将所述第一中间图像输入预训练得到的生成器中,生成所述仿真模糊文本图像。

3.根据权利要求1所述的OCR模型训练方法,其中,所述仿真模糊文本图像由仿真图像生成模型生成,所述仿真图像生成模型包括生成器和鉴别器,所述仿真图像生成模型的训练过程包括:

对清晰的第一训练素材图像和所述模糊核进行卷积运算,得到第二中间图像;

将所述第二中间图像输入所述生成器中,生成模糊的第一输出图像;

将所述第一输出图像和所述真实模糊文本图像输入所述鉴别器中,所述鉴别器根据所述真实模糊文本图像鉴别所述第一输出图像的真实性;

根据所述鉴别器的鉴别结果,对所述生成器和/或所述鉴别器的参数进行调整。

4.一种保险智能理赔方法,包括:

接收用户输入的理赔材料,所述理赔材料包括图片材料;

采用OCR模型识别所述图片材料中的文本相关信息,其中,所述OCR模型由权利要求1至3中任一项所述的OCR模型训练方法训练形成;

至少将所述文本相关信息输入预训练得到的NLP模型中进行语言分析,得到多个目标项目内容;

根据多个所述目标项目内容,按照预设的理赔逻辑进行理赔处理。

5.根据权利要求4所述的保险智能理赔方法,其中,所述文本相关信息包括以下至少之一:文本内容、文本对应的图片、文本在所述图片材料中的位置信息,其中,所述文本对应的图片为从所述图片材料中截取形成的图片;和/或,

所述OCR模型由仿真模糊文本图像、清晰文本图像以及真实模糊文本图像训练生成。

6.根据权利要求4所述的保险智能理赔方法,其中,所述方法还包括:

对所述图片材料进行去模糊处理,得到清晰图片;

在所述理赔处理的结果为理赔失败的情况下,在所述清晰图片上标注出理赔失败的原因对应的区域;

输出所述理赔失败的原因以及经过标注的所述清晰图片。

7.根据权利要求6所述的保险智能理赔方法,其中,所述方法还包括:

对所述理赔处理的结果、所述结果对应的原因以及所述清晰图片进行储存。

8.根据权利要求6所述的保险智能理赔方法,其中,所述对所述图片材料进行去模糊处理,包括:

采用预训练得到的去模糊网络模型对所述图片材料进行迭代处理,得到所述清晰图片。

9.根据权利要求8所述的保险智能理赔方法,其中,所述去模糊网络模型的训练过程包括迭代执行的训练步骤,所述训练步骤包括:

将模糊的第二训练素材图像输入模糊核估计网络模型进行处理,得到估计模糊核;

将所述第二训练素材图像输入初始去模糊网络模型进行迭代处理,得到清晰的第二输出图像;

对所述第二输出图像和所述估计模糊核进行卷积运算,得到模糊的参考图像;

对所述参考图像和所述第二训练素材图像进行差异分析;

根据所述差异分析的结果对所述模糊核估计网络模型和/或所述初始去模糊网络模型进行参数调整,以对所述参考图像和所述第二训练素材图像进行差异最小化优化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310096311.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top