[发明专利]格式类别学习系统以及图像处理装置有效
申请号: | 201810714643.0 | 申请日: | 2018-07-03 |
公开(公告)号: | CN109934244B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 西田笃志 | 申请(专利权)人: | 京瓷办公信息系统株式会社 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;H04N1/393 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 张永玉 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 格式 类别 学习 系统 以及 图像 处理 装置 | ||
1.一种格式类别学习系统,其特征在于,包括:
原始文件图像获取部,获取已记入格式的图像作为原始文件图像;
图像缩小部,缩小所述原始文件图像;
噪声附加部,对由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像通过以彼此不同的位置模式附加噪声,来生成彼此不同的多个机器学习用图像;
标签附加部,将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联;以及
机器学习处理部,将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将所述已记入格式的图像作为输入,将所述格式类别作为输出。
2.根据权利要求1所述的格式类别学习系统,其特征在于,
所述噪声附加部将伪字符图像作为所述噪声附加到所述原始文件图像,来生成多个机器学习用图像,
所述伪字符图像具有矩形形状,并且具有在由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像中可能存在的文字的最小大小至最大大小中的任意大小。
3.根据权利要求2所述的格式类别学习系统,其特征在于,
所述噪声附加部向多个附加位置附加所述伪字符图像,所述伪字符图像具有纵横比彼此不同的矩形形状。
4.根据权利要求2所述的格式类别学习系统,其特征在于,
所述噪声附加部检测所述原始文件图像内的框,向所检测出的所述框的内部附加所述伪字符图像。
5.根据权利要求1所述的格式类别学习系统,其特征在于,
所述噪声附加部随机确定所述噪声的附加位置,在所确定的所述附加位置的浓度与背景浓度不同的情况下,将所述附加位置变更为其他位置,
所述其他位置的浓度是所述背景浓度。
6.一种图像处理装置,其特征在于,包括:
格式图像获取部,获取已记入格式的图像;
第一图像缩小部,将所获取的所述已记入格式的图像缩小为预定大小;以及
分类器,将缩小的所述已记入格式的图像作为输入,将格式类别作为输出,
其中,所述分类器是通过格式类别学习系统进行了机器学习的分类器,
所述格式类别学习系统包括:
原始文件图像获取部,获取已记入格式的图像作为原始文件图像;
第二图像缩小部,缩小所述原始文件图像;
噪声附加部,对由所述第二图像缩小部缩小之前的所述原始文件图像或者由所述第二图像缩小部缩小之后的所述原始文件图像通过以彼此不同的位置模式附加噪声,来生成彼此不同的多个机器学习用图像;
标签附加部,将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联;以及
机器学习处理部,将所述多个机器学习用图像以及所述标签作为训练数据而执行所述分类器的机器学习,
所述预定大小是与用于所述机器学习的所述机器学习用图像相同的大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京瓷办公信息系统株式会社,未经京瓷办公信息系统株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810714643.0/1.html,转载请声明来源钻瓜专利网。