[发明专利]信息处理方法、信息处理设备和扫描仪在审
申请号: | 201910146080.4 | 申请日: | 2019-02-27 |
公开(公告)号: | CN111626076A | 公开(公告)日: | 2020-09-04 |
发明(设计)人: | 王涛;孙俊;于小亿 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈炜;王伟楠 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 设备 扫描仪 | ||
1.一种信息处理设备,用于处理包含文本内容的多个扫描图像,所述装置包括:
处理器,被配置为
在多个扫描图像中分别识别标题文本;
根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;
利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及
根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。
2.如权利要求1所述的信息处理设备,其中,处理器被进一步配置为:
利用基于连接文本提议网络的文本行检测方法,在多个扫描图像中分别检测标题文本行。
3.如权利要求2所述的信息处理设备,其中,处理器被进一步配置为:
利用基于卷积循环神经网络的序列文本识别方法,从所检测到的标题文本行中识别标题文本。
4.如权利要求1所述的信息处理设备,其中,通过针对预定义的多个结构类别,基于标记好的训练图像对基于卷积神经网络的分类器进行训练而获得基于神经网络的特征提取器。
5.如权利要求1至4中任一项所述的信息处理设备,其中,多个扫描图像是通过批扫描获得的。
6.如权利要求5所述的信息处理设备,其中,处理器被进一步配置为:
在多个扫描图像中分别提取页码相关信息;以及
针对被分类为未知结构类别的当前扫描图像,取决于当前扫描图像之前最近的被分类为已知类别的扫描图像的类别、以及从该最近的被分类为已知类别的扫描图像到当前扫描图像的各个扫描图像的页码相关信息,确定是将当前扫描图像归类为该最近的被分类为已知类别的扫描图像的相同类别还是仍保持分类为未知结构类别。
7.如权利要求1至4中任一项所述的信息处理设备,其中,多个扫描图像包括证件、登记文件、表格或合同的扫描图像。
8.一种扫描仪,包括如权利要求1至7中任一项所述的信息处理设备。
9.一种信息处理方法,用于处理包含文本内容的多个扫描图像,所述方法包括:
在多个扫描图像中分别识别标题文本;
根据识别的结果,将每个扫描图像分类为预定义的多个文本类别之一或者未知文本类别;
利用基于卷积神经网络的特征提取器,从被分类为未知文本类别的扫描图像中分别提取图像特征;以及
根据所提取的图像特征,将每个被分类为未知文本类别的扫描图像分类为预定义的多个结构类别之一或者未知结构类别。
10.如权利要求9所述的信息处理方法,其中,利用基于连接文本提议网络的文本行检测方法,在多个扫描图像中分别检测标题文本行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910146080.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:交通干道避免拥堵的系统管理方法
- 下一篇:声源定位方法和装置