[发明专利]一种基于多功能机的文档自动处理方法有效
申请号: | 201210264849.0 | 申请日: | 2012-07-27 |
公开(公告)号: | CN102833449A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 安方确;王凯 | 申请(专利权)人: | 富士施乐实业发展(上海)有限公司 |
主分类号: | H04N1/00 | 分类号: | H04N1/00;G06K9/20 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 吴泽群 |
地址: | 200131 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多功能 文档 自动 处理 方法 | ||
技术领域
本发明属于办公自动化技术领域,特别涉及一种基于多功能机的文档自动处理方法。
背景技术
用电脑处理电子文档是很普遍的技术,运用软件在电脑上对电子文档还能实现各种要求和形式的自动处理。但是在很多场合,仍然非常需要能够对纸质文稿的文字进行某种要求的自动处理,而现有技术中,还不存在这样的自动处理系统。
发明内容
本发明的目的是提供一种基于多功能机的文档自动处理方法,以解决纸质文稿的文字自动处理问题。
本发明的技术方案是,一种基于多功能机的文档自动处理方法,所述的多功能机是指具有扫描、复印和打印功能的机器,包括以下步骤:
使用者在所述多功能机上,将纸质文稿扫描输入该多功能机生成图像格式的第一电子文件;
所述多功能机将所述的第一电子文件传送至服务器,并对服务器发出处理服务请求;
所述服务器对所述第一电子文件内容进行OCR识别处理,识别出该第一电子文件中的文字内容,并记录文字的位置;
所述服务器根据接收的处理服务请求类别指示完成对所述第一电子文件相应的处理服务;
所述服务器将处理完成生成的图像格式的第二电子文件发送回所述多功能机,该多功能机将该第二电子文件打印到纸上并输出。
所述方法进一步包括以下步骤:
使用者在所述多功能机的操作面板上选择拼音自动标注服务,启动多功能机的扫描功能,将纸质文稿内容扫描到多功能机中;
所述多功能机将纸质文稿的扫描内容转化为图像格式,并保存为第一电子文件;
所述多功能机将第一电子文件通过互联网或局域网传送到外置服务器,并对服务器发出拼音标注服务请求;
所述外置服务器端的拼音标注程序启动利用第三方OCR引擎实现的文字识别程序,将接收到的第一电子文件输入到文字识别程序进行OCR处理;
所述文字识别程序识别出图像格式的电子文件中的文字内容并获取各个文字在二维平面上的坐标,文字的大小信息,并将其作为一组,存入预先设计好的数据结构容器中并返回,数据结构容器包含文字-大小-位置-拼音为单位的多组数据;
所述的拼音标注程序启动利用第三方技术实现的拼音识别程序,将数据结构容器输入到拼音识别程序进行拼音识别处理;
所述的拼音识别程序将数据结构容器中数据组按存入先后顺序取出,根据数据组中的位置信息计算出识别并获取各个文字所对应的拼音,并将拼音存入数据结构容器中并返回;
所述拼音标注程序打开第一电子文件,将该第一电子文件的原始内容转换成水印格式;
所述拼音标注程序打开第一电子文件,将数据结构容器中的数据组按顺序取出,根据数据组中的文字大小和坐标信息计算出新的坐标,并将拼音插入图像中的相应位置,重复处理直至所有的数据组中的信息全部的得到处理,最后将处理结果保存为图像格式的第二电子文件;
所述拼音标注程序将第二电子文件发送回多功能机;
所述多功能机将第二电子文件打印到纸上并输出。
本发明利用服务器所提供的检索转换功能(例如发音标注功能)服务,结合具有扫描打印复印等功能的多功能复印机,将多功能机的扫描打印服务器通信功能和服务器端提供的数据处理服务相结合,实现对纸质文稿进行包括发音标注功能的文档内容自动加工,帮助学习中文的用户在中文文稿上自动标注拼音。
附图说明
图1是本发明系统组成示意图
图2是本发明一实施例中方法步骤流程图
具体实施方式
图1是本发明的系统组成示意图。结合图2所示,根据图2的模块组成,本发明的基于多功能机的文档自动处理实现步骤为:
1,将纸质的文稿,放到多功能机的扫描板上,在多功能操作面板上选择拼音自动标注服务,启动多功能机的扫描功能,将文稿内容扫描到多功能机中。
2,多功能机将扫描内容转化为特定的图像格式(例如,Docuworks或PDF),并保存为电子文件。
3,多功能机将图像文件通过互联网或局域网传送到外置服务器,并对服务器发出拼音标注服务请求。
4,服务器端拼音标注程序启动利用第三方OCR引擎实现的文字识别程序,将接收到的图像文件输入到文字识别程序进行OCR处理。
5,文字识别程序识别出图像文件中的文字内容并获取各个文字在二维平面上的坐标,文字的大小信息,并将其作为一组,存入实现设计好的数据结构容器中并返回。数据结构容器包含文字-大小-位置-拼音为单位的多组数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士施乐实业发展(上海)有限公司,未经富士施乐实业发展(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210264849.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种人字拖
- 下一篇:基于电磁波天线阵列信号处理的变电站局部放电定位方法