[发明专利]一种对电子文书进行类别划分的方法和装置在审

专利信息
申请号: 201710157148.X 申请日: 2017-03-16
公开(公告)号: CN108628869A 公开(公告)日: 2018-10-09
发明(设计)人: 王宏刚 申请(专利权)人: 富士施乐实业发展(中国)有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06K9/20;G06K9/62
代理公司: 上海专利商标事务所有限公司 31100 代理人: 陈亮
地址: 200131 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分类类别 方法和装置 分类信息 类别特征 页面
【说明书】:

发明提供一种对电子文书进行类别划分的方法和装置,所述方法包括:a)获取分类信息,所述分类信息指示多个分类类别;b)提取所述电子文书的每个页面对应的类别特征信息;以及c)基于所述类别特征信息,将所述电子文书的每个页面归入所述多个分类类别中的相应分类类别。对应上述方法,本发明提供一种对电子文书进行类别划分的装置。

技术领域

本发明涉及文书分类领域,尤其涉及一种对电子文书进行类别划分的方法和装置

背景技术

近些年,在文书管理领域,在对原稿(纸质,胶片)进行保存的同时,通过扫描形成电子文书进行保存的形式逐渐普及。同时,随着电脑和云技术的发展,OCR技术和图像识别技术也成熟起来。因此在对原稿扫描的同时识别原稿的类别,并自动对电子文档进行分类的需求也日益高涨。

现有技术之一是事先将需要扫描的纸质文书进行人工分类,在扫描开始时即告知扫描仪所扫描纸质文书的类别,扫描仪在扫描的同时按照预先得到的类别信息将得到的电子文书进行分类。

现有技术之二是在上述现有技术基础上的改进,能够同时对多个不同类别的纸质文书进行扫描的同时,对扫描得到的电子文书进行分类。该现有技术也需要事先对纸质文书进行人工分类,并在不同类别的纸质文书之间放置分隔用纸来区分不同类别的原稿。

发明内容

本发明的目的在于提供一种对电子文书进行类别划分的方法和装置,支持对多种类别的文书混合而成的原稿进行分类,且避免了大量的人工分类工作量。

根据上述目的,本发明提供一种对电子文书进行类别划分的方法,所述方法包括:a)获取分类信息,所述分类信息指示多个分类类别;b)提取所述电子文书的每个页面对应的类别特征信息;以及c)基于所述类别特征信息,将所述电子文书的每个页面归入所述多个分类类别中的相应分类类别。

在一实施例中,所述步骤c)进一步包括:c1)针对所述电子文书的每个页面,计算各个分类类别对应的参考类别特征信息与该页面对应的类别特征信息的匹配度;c2)将所述电子文书的每个页面归入与高于阈值的匹配度相关联的分类类别。

在一实施例中,所述类别特征信息为电子文书的图像信息,所述参考类别特征信息为参考类别图像信息。

在一实施例中,所述类别特征信息为电子文书的文字信息,所述参考类别特征信息为参考类别文字信息;所述步骤b)进一步包括:通过OCR算法提取所述电子文书对应的文字信息。

在一实施例中,所述方法还包括:对纸质文书进行扫描,以获得对应的所述电子文书。

在一实施例中,所述方法还包括:按照对所述纸质文书的每个页面的扫描顺序为所述电子文书的每个页面添加页码;将各个页面的页码与该页面所属的分类类别的关系制作成索引页并存储。

在一实施例中,所述步骤a)进一步包括:a1)扫描纸质的分类指示书,以获取电子格式的所述分类指示书,其中所述分类指示书中记载有所述分类信息;a2)对电子格式的所述分类指示书执行图像识别,以获取所述分类信息。

在一实施例中,所述多个分类类别由多层级的母类别和子类别构成;所述步骤c)进一步包括:基于所述类别特征信息,将所述电子文书的每个页面归入相应的末端子类别中。

在一实施例中,所述步骤a)进一步包括:通过GUI画面显示所述多层级的母类别和子类别;响应于用户对所述GUI画面内的所述母类别和/或子类别的勾选选择,以获取所述分类信息。

在一实施例中,还包括:基于所述分类信息生成分类指示书;以及打印所述分类指示书。

在一实施例中,所述方法还包括:创建与所述多层级的母类别和子类别相对应的多层级的文件目录;以及将所述电子文书的各个页面保存至相应的文件目录中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐实业发展(中国)有限公司,未经富士施乐实业发展(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710157148.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top