[发明专利]一种eCTD文档多序列数据恢复方法、系统和存储介质在审

专利信息
申请号: 202211472119.X 申请日: 2022-11-23
公开(公告)号: CN115809217A 公开(公告)日: 2023-03-17
发明(设计)人: 魏巍;唐裕辉;郝华 申请(专利权)人: 明度智云(浙江)科技有限公司
主分类号: G06F16/13 分类号: G06F16/13;G06F16/14;G06F16/16;G06F11/14
代理公司: 杭州合谱慧知识产权代理事务所(特殊普通合伙) 33290 代理人: 张刚
地址: 310056 浙江省杭州市滨江区*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 ectd 文档 序列 数据 恢复 方法 系统 存储 介质
【说明书】:

发明公开了一种eCTD文档多序列数据恢复方法、系统和存储介质,通过对eCTD格式电子文档内存在部分缺失的目标序列文件进行文件结构体系分析,识别缺失内容和所述目标序列文件的关联序列文件;如果目标序列文件中缺失第一叶节点,则创建第一叶节点标签并根据第二叶节点实体文档引用路径恢复第一叶节点实体文档引用路径;如果目标序列文件中缺失第一产品文件夹,则根据所述第二产品文件在关联序列文件中的目录层级位置在目标序列文件的对应位置创建第一产品文件夹,并使用第二产品文件夹的属性信息对第一产品文件夹进行信息补充。从而实现在有缺失文件的情况下通过关联序列进行逆向恢复。

技术领域

本发明涉及信息技术领域,尤其涉及一种eCTD文档多序列数据恢复方法、系统和存储介质。

背景技术

eCTD是用于药品注册申报和审评的电子注册文件。通过可扩展标记语言(Extensible Markup Language,XML)将符合通用技术文档(CTD)规范的药品申报资料以电子化形式进行组织、传输和呈现。其中eCTD申报资料由申请、注册行为和序列三个层级来定义。每个层级都包含一系列相关信息,即申请信息、注册行为信息和序列信息。其中序列是指在某一注册行为中单次提交的申报资料的集合。如附图1所示为新药申请的相关序列示例,其中序列号是申请中唯一的4位数字的字符串,是用于区分同一申请中不同提交序列的唯一标识。在药品研发过程中会经历漫长的阶段,往往会造成eCTD文件的丢失,部分序列中的某些文件版本会产生遗失,因此急需一种在有缺失文件的情况下,进行逆向联想和恢复达到尽可能的兼容缺失的源文件以便后续序列最大程度的正常申报的方法。

发明内容

本发明针对现有技术中的不足,提供了一种eCTD文档多序列数据恢复方法,包括如下步骤:

S1,对eCTD格式电子文档内存在部分缺失的目标序列文件进行文件结构体系分析,识别缺失内容和所述目标序列文件的关联序列文件;

S2,如果目标序列文件中缺失第一叶节点,则在关联序列文件中查找是否存在引用所述第一叶节点的第二叶节点,若存在则获取第二叶节点属性中的引用文档的引用路径,创建第一叶节点标签并根据第二叶节点实体文档引用路径恢复第一叶节点实体文档引用路径;

S3,如果目标序列文件中缺失第一产品文件夹,则在关联序列文件中查找是否存在相同名称的第二产品文件夹,若存在且所述第二产品文件夹具有完整属性信息,则根据所述第二产品文件在关联序列文件中的目录层级位置在目标序列文件的对应位置创建第一产品文件夹,并使用第二产品文件夹的属性信息对第一产品文件夹进行信息补充。

优选的,所述步骤S3还包括:若存在第二产品文件夹但所述第二产品文件夹缺少完整属性信息,则通过解析目录名称和解析第二产品文件夹内实体文档内容去间接联想并补充第二产品文件夹属性信息,根据所述第二产品文件在关联序列文件中的目录层级位置在目标序列文件的对应位置创建第一产品文件夹,并使用补充后的第二产品文件夹属性信息对第一产品文件夹进行信息补充。

优选的,所述步骤S3还包括:若不存在第二产品文件夹或存在第二产品文件夹但缺少完整属性信息且无法补充,则搜寻关联序列中是否存在实体文档的引用地址中包含第一产品文件夹的叶节点,若存在实体文档的引用地址中包含第一产品文件夹的叶节点则根据该引用地址确定第一产品文件夹所在目录层级位置,并在目标序列文件的对应位置创建第一产品文件夹并调整包含的实体文档地址。

优选的,该eCTD文档多序列数据恢复方法,还包括:获取关联序列文件,提取关联序列文件的信封基础信息,所述信封基础信息包括但不限于注册类型、申请编号、联系人信息,根据所述关联序列文件的信封基础信息对目标序列文件中的区域骨干文件上的信封信息部分进行充和恢复。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于明度智云(浙江)科技有限公司,未经明度智云(浙江)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211472119.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top