[发明专利]基于预训练模型的场景适配学习方法及系统在审
申请号: | 202010621371.7 | 申请日: | 2020-07-01 |
公开(公告)号: | CN111783881A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 薛贵荣 | 申请(专利权)人: | 上海天壤智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 201100 上海市闵行*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 训练 模型 场景 学习方法 系统 | ||
1.一种基于预训练模型的场景适配学习方法,其特征在于,包括:
场景接入步骤:根据场景实际的业务需求,接入实际场景数据;
场景配置步骤:通过接入的实际场景数据快速进行实际场景数据的模版配置;
数据生成步骤:模版配置准备完成后,进行数据生成,完成数据增强和带标注信息的训练数据准备;
模型训练步骤:根据生成的训练数据,进一步训练预训练模型,提升预训练模型的精确度。
2.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述实际场景数据指真实识别场景数据的样本,包括:证照、图片以及车牌。
3.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述场景配置步骤包括:
区域圈选:根据场景的图片,对需要识别的区域进行圈选,为在该区域生成新的数据提供一个长方形空间,同时记录这个位置空间的坐标。
数据配置:配合接下来的生产新的训练数据提供标注对象,定义圈选对象内所需生成的数据基本属性,包括数据内容、数据样式以及数据效果,同时定义模板整体施加效果及支持定义输出时的标准答案相关格式及内容。
4.根据权利要求3所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述数据配置需要完成三个维度的数据生成配置:
item:item为信息处理最小单元,一个item内可含有一个或多个标注图层;
标注图层:标注图层表现为图片区域图片所画边框;
图层信息:图层信息包括item类型、辅助标记信息定义,同时根据图层类型,对该图层属性信息进行进一步定义。
5.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述数据生成步骤包括:
素材生成:模版配置好的框中对文字、数字以及图片进行生成,构建多场景的需要识别分析的文字、数字以及图片;
特效生成:对图片进行特效处理,使得所生成数据支持多种贴合真实场景情况,保证模型训练数据样本多样性。
6.根据权利要求5所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述素材生成支持字体库、语料库以及图片库,以丰富生成的数据格式;
字体库:提供基础字体供用户根据实际数据样式进行模板内容字体调整,同时提供实时预览功能方便用户对合适字体进行选取;
语料库:提供文本基础语料供用户根据实际需要对模板内容进行填充,同时支持用户自定义上传所需语料,灵活满足更多使用场景;
图片库:提供文本基础图片素材供用户根据实际需要对模板内容进行填充,同时支持用户自定义上传所需图片,灵活满足更多使用场景;
所述特效包括:光照、3d变换、浮雕、锐化、中位数模糊以及光滑效果。
7.根据权利要求1所述的一种基于预训练模型的场景适配学习方法,其特征在于,所述模型训练步骤:
通过预制的OCR算法、图像识别算法进行训练;
所述预训练模型包括:预置的YOLO图像分类或切分模型、文本检测模型以及文本识别模型。
8.一种基于预训练模型的场景适配学习系统,其特征在于,包括:
场景接入模块:根据场景实际的业务需求,接入实际场景数据;
场景配置模块:通过接入的实际场景数据快速进行实际场景数据的模版配置;
数据生成模块:模版配置准备完成后,进行数据生成,完成数据增强和带标注信息的训练数据准备;
模型训练模块:根据生成的训练数据,进一步训练预训练模型,提升预训练模型的精确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海天壤智能科技有限公司,未经上海天壤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010621371.7/1.html,转载请声明来源钻瓜专利网。