[发明专利]一体化光学字符识别方法和系统在审
申请号: | 201710811919.2 | 申请日: | 2017-09-11 |
公开(公告)号: | CN107633219A | 公开(公告)日: | 2018-01-26 |
发明(设计)人: | 许天涵;张发恩;周恺;王倩;刘昆;肖远昊;徐东泽;孙家元;刘岚 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/68 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司11204 | 代理人: | 王达佐,马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一体化 光学 字符 识别 方法 系统 | ||
1.一种一体化光学字符识别方法,其特征在于,所述方法包括:
接收用户的终端发送的一体化光学字符识别服务获取请求,所述一体化光学字符识别服务获取请求包括:用户选取的属于所述用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;
分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储所述操作结果。
2.根据权利要求1所述的方法,其特征在于,用户从候选操作中选取的操作为训练操作,所述一体化光学字符识别服务获取请求还包括:用户选取的训练数据集的标识;以及
分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作包括:
从分布式文件系统读取所述用户选取的训练数据集的标识对应的训练数据集和所述用户选取的属于所述用户的与光学字符识别相关的模型对应的当前的训练程序;
分布式地利用所述当前的训练程序基于所述训练数据集对用户选取的属于所述用户的与光学字符识别相关的模型执行训练操作,得到训练后的用户选取的属于所述用户的与光学字符识别相关的模型和模型参数;
将训练后的用户选取的属于所述用户的与光学字符识别相关的模型和模型参数存储在分布式文件系统中。
3.根据权利要求1所述的方法,其特征在于,用户从候选操作中选取的操作为预测操作;以及
分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作包括:
从分布式文件系统读取用户选取的属于所述用户的与光学字符识别相关的模型的当前的预测程序;
分布式地利用所述当前的预测程序对待预测数据集执行预测操作,得到预测结果;
将所述预测结果存储在分布式文件系统中。
4.根据权利要求1-3之一所述的方法,其特征在于,所述方法还包括:
分别将每一个与光学字符识别的相关的操作封装为应用程序编程接口。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取用户基于所述应用程序编程接口编写的光学字符识别应用的代码;
建立所述光学字符识别应用与所述用户的用户标识的对应关系。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取用户编写的属于所述用户的与光学字符识别相关的模型的训练程序和预测程序的代码;
将所述训练程序和预测程序作为所述属于所述用户的与光学字符识别相关的模型的当前的训练程序和预测程序。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
接收用户的终端发送的模型下载请求,所述模型下载请求包括:用户选取的属于所述用户的与光学字符识别相关的模型的标识;
将所述模型发送至终端。
8.一种一体化光学字符识别系统,其特征在于,所述系统包括:
接收单元,配置用于接收用户的终端发送的一体化光学字符识别服务获取请求,所述一体化光学字符识别服务获取请求包括:用户选取的属于所述用户的与光学字符识别相关的模型的标识、用户从候选操作中选取的操作的标识,候选操作包括:训练操作、预测操作;
处理单元,配置用于分布式地对用户选取的属于所述用户的与光学字符识别相关的模型执行用户选取的操作,得到操作结果,以及存储所述操作结果。
9.根据权利要求8所述的系统,其特征在于,处理单元包括:
训练子单元,配置用于当用户从候选操作中选取的操作为训练操作以及一体化光学字符识别服务获取请求还包括用户选取的训练数据集的标识时,从分布式文件系统读取所述用户选取的训练数据集的标识对应的训练数据集和所述用户选取的属于所述用户的与光学字符识别相关的模型对应的当前的训练程序;分布式地利用所述当前的训练程序基于所述训练数据集对用户选取的属于所述用户的与光学字符识别相关的模型执行训练操作,得到训练后的用户选取的属于所述用户的与光学字符识别相关的模型和模型参数;将训练后的用户选取的属于所述用户的与光学字符识别相关的模型和模型参数存储在分布式文件系统中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710811919.2/1.html,转载请声明来源钻瓜专利网。