[发明专利]一种对工程文件和数据库建立全文检索文档的方法在审
申请号: | 201910104875.9 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109871473A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 申屠军;郑明光;方舟 | 申请(专利权)人: | 上海核工程研究设计院有限公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93;G06F16/11;G06F16/13;G06F16/14 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 200233*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 工程文件 全文检索 文本文件 数据库建立 文档 数据库转换 内容完整 企业数据 三维模型 数据还原 键信息 可识别 自动地 索引 图纸 数据库 涵盖 计算机 替代 记录 资产 图片 | ||
1.一种对工程文件和数据库建立全文检索文档的方法,其特征在于,它包括如下步骤:
S1、建立OFFICE文档转换模块,该模块能根据OFFICE文档的文件名,自动打开相应的OFFICE软件,然后进行文档另存操作和数据处理,并生成相应的文本文件;
S2、建立图纸信息提取模块,该模块能够识别AutoCAD和其他格式的图纸文件,自动打开相应的设计软件,然后进行文档另存操作和数据处理,并生成相应的文本文件;
S3、建立OCR模块,该模块配备了OCR(optical character recognition)组件,能够识别图片或PDF中的文本信息,并将识别的文本内容写入后缀为“txt”的文件;
S4、建立三维模型数据读取模块,该模块能够读取PDS/PDMS/SP3D的底层数据库内容,并将三维模型中物项的尺寸、材料、和连接关系等的数据写入后缀为“txt”的文件;
S5、建立数据库内容还原模块,该模块连接企业的数据库,读取数据库中的每张数据表中的数据,进行处理后,将每张数据表中的数据写入一个后缀为“txt”的文件;
S6、建立文档存储和索引模块,该模块能够对工程文件的目录进行管理,对目录中的文件逐一识别其格式,然后启动上述步骤S1至步骤S5中建立的模块,生成对应的文本文件,存入新的文件夹中;然后对所有转换后的文本文件,调用全文检索组件,建立索引文件,通过全文检索组件对外提供全文检索服务。
2.如权利要求1所述的对工程文件和数据库建立全文检索文档的方法,其特征在于,所述OFFICE文档转换模块将WORD文档另存(save as)为同名的后缀为“odt”的文件;将EXCEL文档另存(save as)为同名的后缀为“csv”的文件;将VISIO文档另存(save as)为同名的后缀为“vdx”的文件,且同时只保留vdx文件中的<text></text>之间的内容。
3.如权利要求1所述的对工程文件和数据库建立全文检索文档的方法,其特征在于,所述图纸信息提取模块将AutoCAD的图纸另存(save as)为同名的后缀为“csv”的文件。
4.如权利要求1所述的对工程文件和数据库建立全文检索文档的方法,其特征在于,所述数据库内容还原模块将数据表中的外键数据,通过跨表查询后,外键数据(一般是ID)用跨表查询得到的关联表中的数据记录(即关系型数据库的一行)来代替。
5.如权利要求1所述的对工程文件和数据库建立全文检索文档的方法,其特征在于,所述数据库内容还原模块写入txt文件时,采用嵌套的“键-值对”的JSON格式,即对于每条记录,形式如“{字段1:数据1,字段2:{字段21:数据21,字段22:数据22,……},……}”。
6.如权利要求1所述的对工程文件和数据库建立全文检索文档的方法,其特征在于,所述文档存储和索引模块能够分门别类地存放上述转换前的工程文件和转换后的文本文件,同时能够对上述转换后的文本文件建立全文检索的索引,同时提供对外全文检索的服务。
7.如权利要求1所述的对工程文件和数据库建立全文检索文档的方法,其特征在于,所述文档存储和索引模块能够实时识别工程文件的更新或增删情况,并根据更新增删情况,启动前述5个模块,重新对更新或增删的工程文件,重新生成对应的文本文件,并更新全文检索的索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海核工程研究设计院有限公司,未经上海核工程研究设计院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910104875.9/1.html,转载请声明来源钻瓜专利网。