[发明专利]一种自动化实现docx文件细粒度与多样化的批注方法和系统在审
申请号: | 201911059416.X | 申请日: | 2019-11-01 |
公开(公告)号: | CN110968999A | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 数地科技(北京)有限公司 |
主分类号: | G06F40/169 | 分类号: | G06F40/169;G06F40/14 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动化 实现 docx 文件 细粒度 多样化 批注 方法 系统 | ||
1.一种自动化实现docx文件细粒度与多样化的批注方法,其特征在于,包括以下步骤:
获取docx文件的内部XML基础文件;
在docx文件的XML基础文件中生成批注环境;
设置批注信息;
根据生成的批注环境和设置的批注信息,通过修改docx文件的XML基础文件,在待批注位置插入批注信息;
根据批注后的XML基础文件,得到带批注信息的docx文件。
2.根据权利要求1所述的方法,其特征在于,所述获取docx文件内部XML格式的基础文件,包括:通过程序化将docx文件后缀名.docx修改为.zip,然后解压.zip文件,得到包含docx文件对应的内部结构信息的XML文件夹。
3.根据权利要求1或2所述的方法,其特征在于,所述生成批注环境,包括:
若docx文件的XML基础文件无批注信息文件comments.xml,则生成comments.xml文件以创建批注环境,批注索引值默认为0;
若docx文件已有批注内容,则已有批注环境,新增批注的索引值在原有comments.xml文件的子节点的索引值基础上递增。
4.根据权利要求1所述的方法,其特征在于,所述批注信息包括批注定位信息和批注内容信息;所述批注定位信息包括文字段落批注的索引值、表格批注的索引值、图片批注的索引值;所述批注内容信息包括批注内容、批注属性、批注样式;
所述文字段落批注的索引值包括:
段落批注:设置段落索引值,表示批注第几个段落;
句子批注:设置段落索引值与句子索引值,表示批注第几个段落中的第几个句子;
文字批注:设置段落索引值、句子索引值与字索引值,表示批注第几个段落中第几个句子的一个或多个字。
5.根据权利要求4所述的方法,其特征在于,所述通过修改docx文件的XML基础文件,在待批注位置插入批注信息,包括:改变文档信息文件document.xml与批注信息文件comments.xml的XML树的结构,通过插入、修改、删除树的节点来实现自动化批注功能,document.xml用于定位批注位置,comments.xml用于设定批注信息,批注位置与批注信息以批注索引值为桥梁一一对应。
6.根据权利要求5所述的方法,其特征在于:通过批注定位信息在document.xml文件中定位到XML树结构中的节点位置,为当前节点创建批注父节点,并以新创建的批注父节点替代当前节点的位置,其中批注父节点的属性设定为批注索引值,以用于定位批注位置;根据批注内容信息生成批注节点,并在节点属性中设定批注索引值,在comments.xml树结构中追加该批注节点。
7.根据权利要求6所述的方法,其特征在于,所述根据批注内容信息生成批注节点,包括:
获取comments.xml的树结构的全部批注节点;
根据批注属性生成批注节点;
根据批注样式向批注节点添加批注样式子节点;
根据批注内容向批注节点添加批注内容子节点;
将批注样式子节点、批注内容子节点添加到生成的批注节点中,生成完整的批注节点,将该批注节点追加到所述全部批注节点之后。
8.根据权利要求1所述的方法,其特征在于,所述根据批注后的XML基础文件,得到带批注信息的docx文件,包括:压缩所有文件,将后缀名.zip修改为.docx,得到已批注的docx文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于数地科技(北京)有限公司,未经数地科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911059416.X/1.html,转载请声明来源钻瓜专利网。