[发明专利]一种docx文档业务处理、数据利用系统及方法在审
申请号: | 202111310456.4 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114186549A | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 刘显茂;刘科;徐强;申发海 | 申请(专利权)人: | 重庆傲雄在线信息技术有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/186;G06F40/174;G06F40/18 |
代理公司: | 重庆华科专利事务所 50123 | 代理人: | 康海燕;唐锡娇 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 docx 文档 业务 处理 数据 利用 系统 方法 | ||
本发明请求保护一种docx文档业务处理、数据利用系统及方法,涉及计算机信息处理技术领域。上传docx文档文件空白模版、解析模版至文件解析单元,对应空白模版内容在解析模板中增加读取位置示例数据,识别差异化字段、标识映射编码;利用映射编码,配置与空白模板中待填写数据地址的映射关系,从解析模板中选中需要利用的字段,并标识唯一编码,数据录入单元通过标识的唯一编码从解析模板的指定地址提取出需要的结构化数据,根据配置的映射关系填写至空白模板的相应位置。本发明通过Python解析提取出docx文档文件的应用数据,可广泛用于智能化文档、表单录入,解决需大量重复录入表单信息提高效率的问题。
技术领域
本发明涉及计算机信息处理技术领域,具体是一种文本文件处理技术,docx 文件数据写入、提取与利用方法。
背景技术
传统的文件业务处理方式是在docx文档中,编辑好文字后下载打印,签字签章后利用,再将纸质文件数据人工输入系统。无法直接利用docx文档中的数据,这样导致大大降低工作效率和增加数据错误率,使得整个业务流程复杂冗长。
中国发明专利申请CN110083843A,一种CAD图纸翻译方法披露通过Python 解析对象将CAD文件上的文字内容提取出来进行人工或机器翻译,再反填录入 CAD文件中。此方法有效的解决了翻译人员对CAD的学习成本问题,该申请只针对CAD一种文件类型做了解析处理与利用,未对其他文件类型做出相应解决,且解析数据最后是反填回CAD文件内,没有做更多的有利应用。
中国发明专利CN107797978A,用于手写装置的文档中的输入区域的方法和系统。服务器生成表单标识符以识别文档的页面或输入区域;生成用于文档的输入区域的位置和字段类型;将位置和字段类型与表单标识符相关联;并且使用从表单标识符转换的以图形表示的标识符来复制第二文档。位置、字段类型和表单标识符存储在文档的元数据中。客户端装置从手写装置获得从以图形表示的标识符转换的表单标识符。表单标识符与用于第二文档的输入区域的位置和字段类型相关联。表单标识符、位置和字段类型存储在第二文档的元数据中。客户端装置从手写装置获得笔迹的位置信号,并且基于表单标识符、位置和字段类型使位置信号与输入区域相关联。
中国发明专利申请CN108959626A一种跨平台异构数据简报高效自动生成方法,公开了跨平台异构数据简报高效自动生成方法,采用SX404DB键值型数据库集中管理数据;SX404DB键值型数据库为基于倒排索引技术的键值型NoSQL 数据库;通过DocumentScript脚本控制系统来动态生成简报内容;采用向基于 Office OpenXML的格式模板注入内容并将其压缩至DOCX格式文档的方式完成。该方法具有支持海量异构数据,内容生成方式灵活可扩展,简报格式稳定且兼容性高的特点,并具有良好的稳定性、操作性和扩展性。
以上专利文献公开的技术,都仅完成了对文档数据的内部处理以及关联,而对于获取的数据适用于系统内部使用,不能实现与外部系统的有效交互及有效利用,是针对于特定业务场景形成的标准格式电子表单,属于一对一解析利用方式。如需和外部系统交互,还需要人工手动完成。docx文档无法利用,提交docx文档至系统时,无法对文档中需要区域中的数据进行提取利用,只有通过人工复制或者记忆方式提取出来再利用,降低了工作效率以及增加了数据。多份重复docx 文档的数据录入,对于多份不同内容的docx文档,需要填入重复数据时,传统方法只用通过人工复制或者记忆方式提取出来再利用,降低了工作效率以及增加了数据,工作人员需要在多个系统完成数据的重复录入,当一份材料需要在多个系统录入时,需要重复输入繁多的基础数据信息。
发明内容
本发明针对现有技术当需要多份文档重复录入多个系统时候,需要重复输入基础繁多的数据,处理速度慢,数据利用率低的问题,提出一种文本文件数据获取、录入与利用方法。本发明使用一种文本文件处理技术,docx文件数据写入、提取与利用方法可以有效解决数据内部以及外部利用的问题。可结合电子签名、电子签章技术,解决了电子文档必须填写后打印签字签章的难题,并且自动完成关键数据的重复录入,提高了工作效率,减少了纸张的浪费,增加了数据的利用效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆傲雄在线信息技术有限公司,未经重庆傲雄在线信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111310456.4/2.html,转载请声明来源钻瓜专利网。