[发明专利]OCR模型训练方法、保险智能理赔方法及终端设备在审
申请号: | 202310096311.1 | 申请日: | 2023-01-18 |
公开(公告)号: | CN116168399A | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 李晟;郭振华 | 申请(专利权)人: | 阿里巴巴(中国)有限公司 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V10/764;G06V10/82;G06Q40/08;G06N3/044;G06N3/0464;G06N3/08 |
代理公司: | 北京天同知创知识产权代理事务所(普通合伙) 16046 | 代理人: | 张岳峰 |
地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | ocr 模型 训练 方法 保险 智能 理赔 终端设备 | ||
本发明实施例公开了一种OCR模型训练方法、保险智能理赔方法及终端设备,属于文字识别领域,OCR模型训练方法包括:获取清晰文本图像和真实模糊文本图像;从真实模糊文本图像中提取模糊核;根据清晰文本图像和模糊核,生成仿真模糊文本图像;至少采用多个标记有文字内容信息和文字位置信息的仿真模糊文本图像,对OCR模型进行训练。通过本发明,解决了相关技术中的OCR模型对模糊图片中的文字的识别效果差的技术问题。
技术领域
本发明涉及文字识别领域,尤其涉及一种OCR模型训练方法、保险智能理赔方法及终端设备。
背景技术
如今,OCR(OpticalCharacterRecognition,光学字符识别)技术在各行各业中都被广泛的采用,使用OCR技术可以识别图片中的文字,方便地实现文字的提取。然而,相关技术中的OCR技术仅能对清晰的图片中的文字进行有效的识别,对于模糊的图片,文字识别效果差,容易出现识别失败或识别错误的情况。
综上所述,目前相关技术中存在OCR模型对模糊图片中的文字的识别效果差的问题。针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种OCR模型训练方法、保险智能理赔方法及终端设备,以至少解决相关技术中的OCR模型对模糊图片中的文字的识别效果差的技术问题。
根据本发明实施例的第一个方面,提供了一种OCR模型训练方法,包括:获取清晰文本图像和真实模糊文本图像;从真实模糊文本图像中提取模糊核;根据清晰文本图像和模糊核,生成仿真模糊文本图像;至少采用多个标记有文字内容信息和文字位置信息的仿真模糊文本图像,对OCR模型进行训练。
进一步地,根据清晰文本图像和模糊核,生成仿真模糊文本图像,包括:对标记有文字内容信息和文字位置信息的清晰文本图像和模糊核进行卷积运算,得到第一中间图像;将第一中间图像输入预训练得到的生成器中,生成仿真模糊文本图像。
进一步地,仿真模糊文本图像由仿真图像生成模型生成,仿真图像生成模型包括生成器和鉴别器,仿真图像生成模型的训练过程包括:对清晰的第一训练素材图像和模糊核进行卷积运算,得到第二中间图像;将第二中间图像输入生成器中,生成模糊的第一输出图像;将第一输出图像和真实模糊文本图像输入鉴别器中,鉴别器根据真实模糊文本图像鉴别第一输出图像的真实性;根据鉴别器的鉴别结果,对生成器和/或鉴别器的参数进行调整。
根据本发明实施例的第二个方面,还提供了一种保险智能理赔方法,包括:接收用户输入的理赔材料,理赔材料包括图片材料;采用OCR模型识别图片材料中的文本相关信息,其中,OCR模型由上述的OCR模型训练方法训练形成;至少将文本相关信息输入预训练得到的NLP模型中进行语言分析,得到多个目标项目内容;根据多个目标项目内容,按照预设的理赔逻辑进行理赔处理。
进一步地,文本相关信息包括以下至少之一:文本内容、文本对应的图片、文本在图片材料中的位置信息,其中,文本对应的图片为从图片材料中截取形成的图片;和/或,OCR模型由仿真模糊文本图像、清晰文本图像以及真实模糊文本图像训练生成。
进一步地,方法还包括:对图片材料进行去模糊处理,得到清晰图片;在理赔处理的结果为理赔失败的情况下,在清晰图片上标注出理赔失败的原因对应的区域;输出理赔失败的原因以及经过标注的清晰图片。
进一步地,方法还包括:对理赔处理的结果、结果对应的原因以及清晰图片进行储存。
进一步地,对图片材料进行去模糊处理,包括:采用预训练得到的去模糊网络模型对图片材料进行迭代处理,得到清晰图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴(中国)有限公司,未经阿里巴巴(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310096311.1/2.html,转载请声明来源钻瓜专利网。