[发明专利]基于多字典样本加权的文本识别方法在审
申请号: | 202111458126.X | 申请日: | 2021-12-01 |
公开(公告)号: | CN114120321A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 王铎;陈坤;张欣;郭宏泰;孙阳;杨延平;张磊;李磊;时孟旭 | 申请(专利权)人: | 北京比特易湃信息技术有限公司 |
主分类号: | G06V30/10 | 分类号: | G06V30/10;G06V30/18;G06V30/19;G06V10/772;G06V10/82;G06F40/216;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京棘龙知识产权代理有限公司 11740 | 代理人: | 李改平 |
地址: | 100044 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了基于多字典样本加权的文本识别方法,所述基于多字典样本加权的文本识别方法包括如下步骤:预处理和数据增强、特征提取、多头分支、随机Mask、损失加权以及模型更新。本申请的有益之处在不降低模型性能的基础上,可以有效利用已有预训练模型,实现多个字典的联合训练,可迭代使用原训练数据集的模型文件,不用从头训练,即可得到增量式的学习结果,降低了训练的难度和时间;通过对损失计算的优化,缓解了训练样本不均衡的问题,提高模型的精度,基于训练数据集的统计量,通过对损失值做加权,缓解了模型过拟合的程度,提高了模型的精度。 | ||
搜索关键词: | 基于 多字 样本 加权 文本 识别 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京比特易湃信息技术有限公司,未经北京比特易湃信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111458126.X/,转载请声明来源钻瓜专利网。
- 上一篇:一种平移透镜式调焦防水目镜
- 下一篇:一种智慧校园素质教育评估系统及方法