[发明专利]一种文字识别训练系统及方法在审

申请号：	201811538406.X	申请日：	2018-12-16
公开（公告）号：	CN109753966A	公开（公告）日：	2019-05-14
发明（设计）人：	胡杰	申请（专利权）人：	初速度（苏州）科技有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/62;G06N3/04
代理公司：	北京挺立专利事务所(普通合伙) 11265	代理人：	赵振
地址：	215131 江苏省苏州市相城区高***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	损失函数文字识别训练系统中文文字文字识别技术文字识别系统训练神经网络分类
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种文字识别训练系统及方法，属于文字识别技术；现有技术中，在训练神经网络过程中仅仅使用序列损失函数，但是中文文字繁多，其有众多字形相似，该损失函数效果不好，本发明提供了一种文字识别系统及方法，其损失函数采用序列损失函数与分类损失函数，有效的解决了中文文字识别过程中的分类错误。

技术领域

本发明涉及一种文字识别技术，特别是涉及中文文字识别训练方法。

背景技术

现今基于深度学习的文字识别训练结构大都如图1所示，首先由卷积神经网络等特征提取模型提取图片特征，之后使用循环神经网络或者自然语言处理等方法生成文字序列结果，采用序列模型的损失函数进行对齐和计算损失。训练过程中，通过序列损失函数间接调整特征提取模型，使之能提取出最具表达能力的特征。这在英文的文字识别模型中得到了很好的结果。但是中文的文字识别比英文文字识别在任务的复杂度上有明显的区别，首先是巨大的字符数量差异，英文只需识别26个字母，但是中文仅常用字库就有三四千的数目；并且，很多中文文字形状相似但意义大不相同，这也给准确识别带来了难度，例如对于像“莱”、“菜”这种形似的字符，容易产生混淆。观察发现，多数文字识别错误的原因是检错文字类别。特别是在自动驾驶、辅助驾驶领域，文字的正确识别是实现自动或辅助驾驶的重要环节。亟待需要一种用于自动驾驶、辅助驾驶的文字识别方法和系统。

发明内容

现有技术中对于文字的识别较少采用神经网络进行训练，更没有对已有神经网络进行优化。鉴于现有技术中存在的问题，本发明提供一种文字识别训练系统，其特征在于

特征提取单元、文字识别单元和损失函数单元；

所述特征提取单元对待识别文字的图片或图像进行特征提取；

所述文字识别单元将输入的所述特征进行文字识别得到识别结果；

所述系统还包括：通过待识别文字的图片或图像的预先标注，与所述识别结果进行对比，并构建损失函数，并存储于损失函数单元，由所述损失函数单元中的所述损失函数逐级反向传导，逐级修正所述文字识别单元和所述特征提取单元；

所述损失函数由两种不同类型的损失函数之和构成。

优选地，所述两种不同类型的损失函数分别为序列损失函数和分类损失函数。

优选地，所述分类损失函数表达字形相同的文字出现识别错误的概率。

优选地，所述系统的损失函数＝a*序列损失函数+b*分类损失函数，其中a、b为权重系数。

优选地，所述文字识别单元包括第一文字识别单元和第二文字识别单元，其分别对应列损失函数和分类损失函数。

优选地，所述系统还包括映射单元，其通过词典或字典的映射来预测所述识别结果。