[发明专利]文档结构化方法和设备在审
申请号: | 201611067223.5 | 申请日: | 2016-11-28 |
公开(公告)号: | CN106776851A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 沈滢;朱彬若;翁素婷;顾臻;吕春;周菁菁 | 申请(专利权)人: | 国网上海市电力公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 200002 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 结构 方法 设备 | ||
1.一种文档结构化方法,其特征在于,包括:
步骤S1:接收文档,创建该文档的结构化描述文件,并将文档保存至文档服务器中;
步骤S2:创建数据库,并存储所有文档的结构化描述文件;
步骤S3:在数据库中检索得到结构化描述文件后,于文档服务器中提取对应的文档。
2.根据权利要求1所述的一种文档结构化方法,其特征在于,所述步骤S1具体包括步骤:
步骤S11:接收文档;
步骤S12:提取文档已有标签;
步骤S13:生成文档的摘要;
步骤S14:用标记描述文档的标签和摘要生成该文档的结构化描述文件;
步骤S15:将文档保存至文档服务器中。
3.根据权利要求2所述的一种文档结构化方法,其特征在于,所述文档已有标签至少包括文档大小、文档来源、文档类别、文档修改时间、文档所属标准体系。
4.根据权利要求2所述的一种文档结构化方法,其特征在于,所述步骤S13具体包括步骤:
步骤S131:判断是否存在支持该文档的阅读模块,若为是,则执行步骤S132,若为否,则执行步骤S133;
步骤S132:采用该阅读模块打开该文档并提取文档中的部分文本作为文档的摘要;
步骤S133:接收由用户端输入的对该文档的摘要。
5.根据权利要求1所述的一种文档结构化方法,其特征在于,所述步骤S3具体为:在数据库中检索得到结构化描述文件后,判断当前用户是否存在对对应文档的操作权限,若为是,则于文档服务器中提取对应的文档,若为否,则返回错误信息。
6.一种文档结构化设备,其特征在于,包括:
用于接收文档,创建该文档的结构化描述文件,并将文档保存至文档服务器中的第一装置;
用于创建数据库,并存储所有文档的结构化描述文件的第二装置;
用于在数据库中检索得到结构化描述文件后,于文档服务器中提取对应的文档的第三装置。
7.根据权利要求6所述的一种文档结构化设备,其特征在于,所述第一装置包括:
用于接收文档的第一模块;
用于提取文档已有标签的第二模块;
用于生成文档的摘要的第三模块;
用于用标记描述文档的标签和摘要生成该文档的结构化描述文件的第四模块;
用于将文档保存至文档服务器中的第五模块。
8.根据权利要求7所述的一种文档结构化设备,其特征在于,所述文档已有标签至少包括文档大小、文档来源、文档类别、文档修改时间、文档所属标准体系。
9.根据权利要求7所述的一种文档结构化设备,其特征在于,所述第三模块包括:
用于判断是否存在支持该文档的阅读模块的第一单元;
用于采用该阅读模块打开该文档并提取文档中的部分文本作为文档的摘要的第二单元;
用于接收由用户端输入的对该文档的摘要的第三单元。
10.根据权利要求6所述的一种文档结构化设备,其特征在于,所述第三装置包括
用于在数据库中检索得到结构化描述文件后,判断当前用户是否存在对对应文档的操作权限的第六模块;
用于于文档服务器中提取对应的文档的第七模块;
用于返回错误信息的第八模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司,未经国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611067223.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:快速搜索方法、装置及终端
- 下一篇:资源处理方法及装置