[发明专利]一种字符识别模型的训练方法和装置有效
申请号: | 201710985282.9 | 申请日: | 2017-10-20 |
公开(公告)号: | CN109697442B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 程孟力;隋宛辰;施兴 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/164;G06V30/19 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请实施例公开了一种字符识别模型的训练方法和装置,该方法包括获取真实数据样本、第一生成样本和第二生成样本,真实数据样本为具有噪声的数据样本,第一生成样本和第二生成样本为不具有噪声的数据样本,真实数据样本和第一生成样本中包括的字符相同,根据真实数据样本和第一生成样本确定噪声对真实数据样本中字符所造成影响的特征,并根据噪声对真实数据样本中字符所造成影响的特征和第二生成样本模拟出模拟结果,用于模拟在噪声影响下的第二生成样本的特征,将模拟结果应用于字符识别模型的训练,可以提高字符识别模型在识别真实场景中受同类噪声影响的、包括与第二生成样本相同字符的真实样本的识别准确率。 | ||
搜索关键词: | 一种 字符 识别 模型 训练 方法 装置 | ||
【主权项】:
1.一种字符识别模型的训练方法,其特征在于,所述方法包括:获取真实数据样本、第一生成样本和第二生成样本,所述真实数据样本为具有噪声的数据样本,所述第一生成样本和第二生成样本为不具有噪声的数据样本,所述真实数据样本中包括的字符与所述第一生成样本包括的字符相同,所述第一生成样本中包括的字符与所述第二生成样本中包括的字符不同;将所述真实数据样本进行卷积计算得到真实卷积结果,将第一生成样本进行所述卷积计算得到第一卷积结果,将第二生成样本进行所述卷积计算得到第二卷积结果;根据所述真实卷积结果和所述第一卷积结果确定出所述噪声对所述真实数据样本中字符所造成影响的特征,并根据所述噪声对所述真实数据样本中字符所造成影响的特征和所述第二卷积结果模拟出模拟结果,所述模拟结果用于模拟在所述噪声影响下的所述第二生成样本进行所述卷积计算得到的卷积结果;将所述模拟结果用于字符识别模型的训练。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710985282.9/,转载请声明来源钻瓜专利网。