[发明专利]一种文件分类协作机器人及基于其的图像文字识别方法在审
申请号: | 202010182139.8 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111428710A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 邓辅秦;李伟科;林淮荣;黄永深;冯华;岳洪伟;丁毅;龙佳乐;张建民;王栋;钟东洲;李澄非;习江涛 | 申请(专利权)人: | 五邑大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06K9/00 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 孙浩 |
地址: | 529000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 分类 协作 机器人 基于 图像 文字 识别 方法 | ||
1.一种文件分类协作机器人,其特征在于,包括:
摄像装置,用于对文件进行图像拍摄;
机器人主体,用于将所述文件放至用户指定位置;
上位机,用于对文本图片中文字进行识别输出并相应地统筹控制所述机器人主体进行移动,分别与所述摄像装置和所述机器人主体相连接。
2.基于权利要求1所述的一种文件分类协作机器人的图像文字识别方法,其特征在于,包括:
将所获取的文本行图片转化为标准文本行图片;
根据所述标准文本行图片构建图片文字识别模型;
基于所述图片文字识别模型输出待识别文本图片中的文字。
3.根据权利要求2所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,所述的将所获取的文本行图片转化为标准文本行图片,包括:
根据所获取的文本行图片形成预设的文本行二值化图片;
根据所述待识别文本图片确定预设的背景图片;
将所述文本行二值化图片和所述背景图片进行合成处理,得到标准文本行图片。
4.根据权利要求3所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,所述的根据所获取的文本行图片形成预设的文本行二值化图片,包括:
从所获取的文本行图片中提取若干相关的文本内容;
将所述文本内容处理生成对应的文本图像;
根据所述文本图像形成预设的文本行二值化图片。
5.根据权利要求3所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,所述的根据待识别文本图片确定预设的背景图片,包括:
根据所述待识别文本图片确定相关的标准模板图片;
从所述标准模板图片中获取无文字的背景区域;
根据所述无文字的背景区域形成预设的背景图片。
6.根据权利要求2所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,所述的根据所述标准文本行图片构建图片文字识别模型,包括:
根据所述标准文本行图片得到对应的样本图片;
整合所述样本图片以及所述样本图片中的文本内容,形成训练样本集;
基于所述训练样本集通过深度神经网络构建图片文字识别模型,其中,所述深度神经网络被设计为以所述样本图片为训练数据,以所述样本图片的文本内容为标签。
7.根据权利要求6所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,所述的根据所述标准文本行图片得到对应的样本图片,包括:
对所述标准文本行图片进行扩充变化处理,得到对应的样本图片,其中,所述的扩充变化处理包括透视变换、色调变换、添加阴影效果、添加高光效果、添加噪点、裁剪、缩放以及压缩中的一种处理或多种处理。
8.根据权利要求2所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,所述的基于所述图片文字识别模型输出待识别文本图片中的文字,包括:
从所述待识别文本图片中的文字中获取若干相关词条;
对若干所述词条进行拆分组合,生成新词条;
将所述新词条按照预设的字体类型转换为对应的文本内容。
9.根据权利要求2或8所述的基于一种文件分类协作机器人的图像文字识别方法,其特征在于,当所述的基于所述图片文字识别模型输出所述待识别文本图片中的文字之后,还包括:
将输出的所述待识别文本图片中的文字与所述上位机中所确定的用户分类规则进行比较,若两者保持一致,则通过上位机发送指令使所述机器人主体将所述文件放至用户指定位置,否则,返回获取文本行图片并执行所述的图像文字识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于五邑大学,未经五邑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010182139.8/1.html,转载请声明来源钻瓜专利网。