[发明专利]基于python完成word表格转秩的方法及系统在审
申请号: | 202210972520.3 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115358197A | 公开(公告)日: | 2022-11-18 |
发明(设计)人: | 王正沛;崔乐乐;李抑允 | 申请(专利权)人: | 天元大数据信用管理有限公司 |
主分类号: | G06F40/18 | 分类号: | G06F40/18;G06F40/186 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 python 完成 word 表格 方法 系统 | ||
1.一种基于python完成word表格转秩的方法,其特征在于,该方法是基于SpringBoot框架,采用java+python语言编写,并采用mysql作为数据库,同时采用mybatis作为数据库交互;再基于VUE构建前端页面进行交互,实现文件上传及目标表的生成和下载;并调用python进行word表格的数据抽取并生成excel表,保证数据处理的效率。
2.根据权利要求1所述的基于python完成word表格转秩的方法,其特征在于,该方法具体如下:
S1、判断是否输入模板:
①、若是,则提取模板字段,下一步执行步骤S2;
②、若否,则跳转至步骤S2;
S2、识别所有目标word表格文档;
S3、统一文件格式为docx;
S4、比对字段值及数量,排除非模板模式文档;
S5、判断是否存有模板字段:
①、若是,则排除模板字段,下一步执行步骤S6;
②、若否,则跳转至步骤S6;
S6、将word表格文档字段导出成excel;
S7、调整字段。
3.根据权利要求1或2所述的基于python完成word表格转秩的方法,其特征在于,通过前端页面交互,设定word表格中哪些字段为字段名以及哪些字段为字段值。
4.根据权利要求3所述的基于python完成word表格转秩的方法,其特征在于,设定word表格中哪些字段为字段名以及哪些字段为字段值具体如下:
对导入的word表格模板的字段进行提取,作为预制字段名;
在后续word表格提取的字段中自动过滤掉字段名,只将字段值汇总成excel表格。
5.根据权利要求4所述的基于python完成word表格转秩的方法,其特征在于,字段名的确认方式是通过上传空白模板,并自动过滤掉批量word表格文档中的字段名,并将字段值进行汇总。
6.根据权利要求1或2所述的基于python完成word表格转秩的方法及系统,其特征在于,word表格进行数据处理时,选择对word表格进行无差别识别,将word表格中的所有字段均对应生成在excel表中,并进行调整。
7.一种基于python完成word表格转秩的系统,其特征在于,该系统包括,
判断模块一,用于判断是否输入模板;
提取模块,用于提取模板字段;
识别模块,用于识别所有目标word表格文档;
格式统一模块,用于统一文件格式为docx;
比对模块,用于比对字段值及数量,排除非模板模式文档;
判断模块二,用于判断是否存有模板字段;
排除模块,用于排除模板字段;
导出模块,用于将word表格文档字段导出成excel;
调整模块,用于调整字段。
8.根据权利要求7所述的基于python完成word表格转秩的系统,其特征在于,该系统打包成jar包或者可执行文件,在本地运行,具体如下:
选择基于springBoot打包成jar包集成进其他系统,做二次开发;
或者,
基于python生成exe可执行文件,使用时将该执行文件与待处理文件放在一起,双击运行,即可生成汇总的excel表格。
9.一种电子设备,其特征在于,包括:存储器和至少一个处理器;
其中,所述存储器上存储有计算机程序;
所述至少一个处理器执行所述存储器存储的计算机程序,使得所述至少一个处理器执行如权利要求1至6任一项所述的基于python完成word表格转秩的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序可被处理器执行以实现如权利要求1至6中任一项所述的基于python完成word表格转秩的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天元大数据信用管理有限公司,未经天元大数据信用管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210972520.3/1.html,转载请声明来源钻瓜专利网。