[发明专利]一种对工程文件和数据库建立全文检索文档的方法在审
申请号: | 201910104875.9 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109871473A | 公开(公告)日: | 2019-06-11 |
发明(设计)人: | 申屠军;郑明光;方舟 | 申请(专利权)人: | 上海核工程研究设计院有限公司 |
主分类号: | G06F16/93 | 分类号: | G06F16/93;G06F16/11;G06F16/13;G06F16/14 |
代理公司: | 上海精晟知识产权代理有限公司 31253 | 代理人: | 冯子玲 |
地址: | 200233*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的目的在于公开一种对工程文件和数据库建立全文检索文档的方法,自动地将企业数据资产中的工程文件和数据库转换为计算机可识别的文本文件,并建立全文检索的索引,针对的工程文件,涵盖了大部分的OFFICE文件、图纸、图片或PDF文档、和三维模型等,将数据库中的数据还原成“内容完整”的键值对格式的文本文件,把外键信息用完整的记录替代,同时每个数据值都有对应的数据名,全文检索的效率更高,准确性更好,实现本发明的目的。 | ||
搜索关键词: | 工程文件 全文检索 文本文件 数据库建立 文档 数据库转换 内容完整 企业数据 三维模型 数据还原 键信息 可识别 自动地 索引 图纸 数据库 涵盖 计算机 替代 记录 资产 图片 | ||
【主权项】:
1.一种对工程文件和数据库建立全文检索文档的方法,其特征在于,它包括如下步骤:S1、建立OFFICE文档转换模块,该模块能根据OFFICE文档的文件名,自动打开相应的OFFICE软件,然后进行文档另存操作和数据处理,并生成相应的文本文件;S2、建立图纸信息提取模块,该模块能够识别AutoCAD和其他格式的图纸文件,自动打开相应的设计软件,然后进行文档另存操作和数据处理,并生成相应的文本文件;S3、建立OCR模块,该模块配备了OCR(optical character recognition)组件,能够识别图片或PDF中的文本信息,并将识别的文本内容写入后缀为“txt”的文件;S4、建立三维模型数据读取模块,该模块能够读取PDS/PDMS/SP3D的底层数据库内容,并将三维模型中物项的尺寸、材料、和连接关系等的数据写入后缀为“txt”的文件;S5、建立数据库内容还原模块,该模块连接企业的数据库,读取数据库中的每张数据表中的数据,进行处理后,将每张数据表中的数据写入一个后缀为“txt”的文件;S6、建立文档存储和索引模块,该模块能够对工程文件的目录进行管理,对目录中的文件逐一识别其格式,然后启动上述步骤S1至步骤S5中建立的模块,生成对应的文本文件,存入新的文件夹中;然后对所有转换后的文本文件,调用全文检索组件,建立索引文件,通过全文检索组件对外提供全文检索服务。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海核工程研究设计院有限公司,未经上海核工程研究设计院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910104875.9/,转载请声明来源钻瓜专利网。