[发明专利]信息处理方法、信息处理设备和扫描仪在审
申请号: | 201910146080.4 | 申请日: | 2019-02-27 |
公开(公告)号: | CN111626076A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 王涛;孙俊;于小亿 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈炜;王伟楠 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 设备 扫描仪 | ||
本公开提供了信息处理方法、信息处理设备和扫描仪。信息处理设备包括处理器,该处理器被配置为:在多个扫描图像中分别识别标题文本;根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。
技术领域
本公开总体上涉及信息处理领域,具体而言,涉及用于处理包含文本内容的多个扫描图像的信息处理方法以及能够实现该信息处理方法的信息处理设备和扫描仪。
背景技术
银行、旅游服务中心、街道办事处、出入境大厅等组织机构通常需要每天收集来自不同客户或申请人的大量文件并进行分类。每个客户或申请人可能提供不同类型的多项文件,如身份证、银行卡、婚姻证明、户籍证明、申请表格、相关合同及其他证明文件等,并且自行扫描或由相关机构的工作人员扫描,从而保存电子版。
借助于现有的扫描仪等设备,可以自动收集所有文档图像。然而,扫描文档图像的后续分类工作仍需要手动完成。对于相关机构而言,这是一项庞大而繁重的工作,耗费了大量的人力资源。
因此,期望提供一种能对扫描文档图像(也可称为包含文本内容的扫描图像)进行自动分类的方法,以提高处理效率。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于对能够将扫描文档图像自动分类的方法的需求,本发明的目的之一是提供一种信息处理方法以及能够实现该信息处理方法的信息处理设备和扫描仪,其能够对包含文本内容的多个扫描图像进行自动分类。
根据本公开的一个方面,提供了一种信息处理方法,其包括:在多个扫描图像中分别识别标题文本;根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。
根据本公开的另一方面,提供了一种信息处理设备,其包括处理器,所述处理器被配置为:在多个扫描图像中分别识别标题文本;根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。
根据本公开的再一方面,提供了一种扫描仪,其包括根据本公开的上述信息处理设备。
依据本公开的其它方面,还提供了一种使得计算机实现如上所述的信息处理方法的程序。
依据本公开的又一方面,还提供了相应的存储介质,其存储有机器可读取的指令代码,所述指令代码在由机器读取并执行时,能够使得机器执行上述信息处理方法。
上述根据本公开实施例的各个方面,至少能够获得以下益处:利用本公开所提供的信息处理方法、信息处理设备、扫描仪、程序和存储介质,可以对多个包含文本内容的扫描图像进行自动分类。
通过以下结合附图对本公开的最佳实施例的详细说明,本公开的这些以及其他优点将更加明显。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910146080.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:交通干道避免拥堵的系统管理方法
- 下一篇:声源定位方法和装置