[发明专利]格式类别学习系统以及图像处理装置有效
申请号: | 201810714643.0 | 申请日: | 2018-07-03 |
公开(公告)号: | CN109934244B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 西田笃志 | 申请(专利权)人: | 京瓷办公信息系统株式会社 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;H04N1/393 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 张永玉 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 格式 类别 学习 系统 以及 图像 处理 装置 | ||
本发明提供格式类别学习系统以及图像处理装置。格式类别学习系统包括原始文件图像获取部、图像缩小部、噪声附加部、标签附加部及机器学习处理部。原始文件图像获取部获取已记入格式的图像作为原始文件图像。图像缩小部缩小原始文件图像。噪声附加部向由图像缩小部缩小之前的原始文件图像或由图像缩小部缩小之后的原始文件图像附加噪声,并生成多个机器学习用图像。标签附加部将原始文件图像的格式类别作为标签而与多个机器学习用图像相关联。机器学习处理部将多个机器学习用图像及标签设为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入并将格式类别作为输出。本发明能够无需使用格式布局信息就能够准确地进行格式分类。
技术领域
本发明涉及格式类别学习系统以及图像处理装置。
背景技术
在某文件管理系统中,确定由数码复合机扫描的文件的格式,并且在与格式对应的文件夹中保存该文件。另外,在该文件管理系统中,基于表示格式内的框/表的位置以及大小、格式内的文字等的格式布局信息,来识别格式。
发明内容
本发明涉及的格式类别学习系统具备原始文件图像获取部、图像缩小部、噪声附加部、标签附加部以及机器学习处理部。原始文件图像获取部获取已记入格式的图像作为原始文件图像。图像缩小部缩小所述原始文件图像。噪声附加部向对由所述图像缩小部缩小之前的所述原始文件图像或者由所述图像缩小部缩小之后的所述原始文件图像附加噪声,来生成多个机器学习用图像。标签附加部将所述原始文件图像的格式类别作为标签而与所述多个机器学习用图像相关联。机器学习处理部将所述多个机器学习用图像以及所述标签作为训练数据而执行分类器的机器学习,所述分类器将已记入格式的图像作为输入,将格式类别作为输出。
附图说明
图1示出本发明的实施方式涉及的格式类别学习系统的结构;
图2示出在图1中的分类器27的机器学习中使用的已记入格式的一个例子;
图3示出与图2所示的已记入格式对应的机器学习用图像的一个例子;
图4说明图1所示的格式类别学习系统中的格式类别的机器学习。
具体实施方式
以下,基于附图,对本发明的实施方式进行说明。
图1是示出本发明的实施方式涉及的格式类别学习系统的结构的框图。在图1所示的系统中,图像处理装置1经由网络2而与服务器装置3之间进行通信。
图1中的图像处理装置1例如为数码复合机等图像形成装置,包括图像读取装置11、输入装置12、显示装置13、存储装置14、通信装置15以及运算处理装置16。
图像读取装置11以光学方式读取文件(这里是已记入的格式)的图像,并生成该图像的图像数据。
输入装置12是检测用户操作并输出表示用户操作的信息的硬键、触控面板等装置。显示装置13是向用户显示各种信息的液晶显示器等装置。例如,输入装置12以及显示装置13被配置在操作面板上,该操作面板设置于框体的表面上。
存储装置14是硬盘、闪存等非易失性的存储装置。
通信装置15是与网络2连接、且在与其他装置(服务器装置3等)之间进行数据通信的网络接口等装置。
运算处理装置16包括执行各种程序的计算机、ASIC(Application SpecificIntegrated Circuit,专用集成电路)等,通过计算机、ASIC等,作为各种处理部而工作。
这里,为了格式类别的机器学习,运算处理装置16作为原始文件图像获取部21、图像缩小部22、噪声附加部23以及标签附加部24而工作。另外,为了格式的分类,运算处理装置16作为格式图像获取部25、图像缩小部26、分类器27、格式处理部28以及参数设定部29而工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京瓷办公信息系统株式会社,未经京瓷办公信息系统株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810714643.0/2.html,转载请声明来源钻瓜专利网。