[发明专利]一种文字检测及识别的方法及系统在审

申请号：	201810818780.9	申请日：	2018-07-24
公开（公告）号：	CN109034155A	公开（公告）日：	2018-12-18
发明（设计）人：	房鹏展;夏宇;吕晨	申请（专利权）人：	百卓网络科技有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06N3/04;G06N3/08
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	陈建和
地址：	210000 江苏省南京市***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种文字检测及识别的方法及系统，应用于识别图片中的文字信息，根据数据集中的文字区域位置，利用深度神经网络训练文字区域检测模型，然后根据文字区域图片与对应的文字信息训练文字识别模型，通过文字区域检测模型，可以检测出图片中的文字区域，通过文字识别模型，可以识别文字区域图片中的文字信息，两个模型结合起来可以实现图片中的文字信息识别。该方法和系统能够高效准确的完成图片文字检测及识别任务，能够应用到很多场景下的文字自动识别及录入工作，大大减少人力成本。
搜索关键词：	文字信息文字区域检测文字区域图片文字检测文字区域文字识别神经网络训练图片文字检测模型结合人力成本数据集中自动识别录入图片应用场景检测
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种文字检测及识别的方法，其特征在于，包括如下步骤：步骤一：准备数据集，包括文字图片中的文字区域位置、区域文字信息，数据集可以通过人工标注或者自动生成获得；步骤二：根据文字区域位置，利用深度神经网络训练文字区域检测模型，并对模型进行评估及优化，对于文字区域检测模型，输入为一张图片Imagei，输出为{Regionik}，其中i表示第i个图片，k＝1,...,t，t表示第i个图片中有t个文字区域，Regionik表示第i个图片中第k个文字区域；利用深度神经网络训练一个文字区域检测模型，使得F(Imagei)＝{Regionik}。步骤三：根据文字区域图片与对应的文字信息，利用深度神经网络训练文字识别模型，并对模型进行评估及优化；对于文字识别模型，输入为步骤二中得到的校正的文字区域图片CImageik，输出为对应的文字信息Stringik；利用深度神经网络训练一个文字区域检测模型，使得G(CImageik)＝Stringik；步骤四：对于待识别的图片，调用F模型，得到t个文字区域矩形，并进行旋转校正，得到t个校正的文字区域图片；步骤五：对于t个校正的文字区域图片，分别调用G模型，得到t个区域对应的文字信息，将这些信息返回。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于百卓网络科技有限公司，未经百卓网络科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810818780.9/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种文字检测及识别的方法及系统在审

专利文献下载