[发明专利]自动化API接口文档解析配置方法、系统、装置及存储介质在审
申请号: | 202010254667.X | 申请日: | 2020-04-02 |
公开(公告)号: | CN111553150A | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 刘劲柏;杨超 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/205;G06F40/169;G06F40/151;G06F16/21;G06K9/62 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 袁文婷;王迎 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自动化 api 接口 文档 解析 配置 方法 系统 装置 存储 介质 | ||
本发明提出一种自动化API接口文档解析配置方法、电子装置及存储介质,其中,该方法包括:获取API接口文档样本内的历史报文信息;对历史报文信息进行分段标注,并根据分段标注后的历史报文信息对预设的自动分词标注模型进行训练;获取实时报文信息,并通过自动分词标注模型对实时报文信息进行处理,以获取实时报文体;最后获取实时报文体中的请求参数、返回参数以及IP地址;并请求参数、返回参数以及IP地址以Json格式保存至预设的excel数据库。本发明提供技术方案能够实现API接口文档的自动解析与配置,提高API接口文档处理的工作效率。
技术领域
本发明涉及数据解析配置技术领域,尤其涉及一种自动化API接口文档解析配置方法、系统、装置及存储介质。
背景技术
文本数据是由一些具体的数据单位构成的,例如字、词、词组、句子、段落或这些具体的数据单位的组合,都可以称之为文本数据,文本信息正是由具体的数据单位构成的一种组合型信息文本。
在传统系统集成中,经常需要阅读大量的API接口文档,然后根据API接口文档内的特定信息进行相应代码开发或系统配置。然而,由于这些API接口文档内的各种数据信息的数据类型不同,因此通过人工阅读的方式获取这些API接口文档内的特定信息,往往会出现漏记、错记的现象,此外,整个人工阅读过程虽然操作简单,但需要大量的重复操作,效率极低,人员投入很大,入不敷出,缺少创造性。
在实际应用中,关于API接口文档中特定信息的提取,有些企业已经引入了文本信息提取技术,文本信息提取技术是从文本信息中提取特定信息的一种技术。提取文本数据中所需的名词短语、人名、地名等都是属于文本信息提取技术的范畴。但是,现有的文本信息提取技术只能从文本信息中抽取具有简单结构特性的特定信息,并不能够精准地提取出文本信息中的全部特定信息,从而严重降低特定信息的利用率,此时,为提高特定信息的利用率,一般会使用人工继续对文本信息进行进一步特定信息提取。
此外,现有的文本信息提取技术对于文本信息的数据类型也有一定的数据要求;不同的数据类型的文本信息使用的特征提取方法以及提取关键字均不同,例如,API接口文档内的数据类型多种多样,包括xml、pdf、word、json等等,各种类型的数据均需要配置相应的特征提取方法。另外,在API接口文档中,一些类型的数据是分布在另一些类型的数据中的,比如,IP地址信息和参数信息并不全都伴随相应的关键字出现,而是隐藏在报文信息中,因此,使用传统的文本信息提取技术无法提取。
所以,虽然有些企业已经在系统集成中使用了传统的文本信息提取技术,但这种技术并不能自动的提取到各类文档中的所有关键信息,如接口参数、IP地址、Json报文样例、XML报文样例等,从而完成对API的描述。
基于以上几个问题,亟需一种能够高效率的自动解析出API接口文档中所有特定信息的方法。
发明内容
本发明提供一种自动化API接口文档解析配置方法、系统、电子装置以及计算机存储介质,其主要目的在于解决现有的系统集成中,使用传统的文本信息提取技术不能自动的提取到各类文档中的所有关键信息的问题。
为实现上述目的,本发明提供一种自动化API接口文档解析配置方法,该方法包括如下步骤:
对历史API接口文档样本进行预处理,以获取所述历史API接口文档样本内的历史报文信息;
对所述历史报文信息进行分段标注,以实现对所述历史报文信息中的报文开头、报文结尾、报文体以及非报文体的标注,并根据分段标注后的历史报文信息对预设的自动分词标注模型进行训练;
获取待配置API接口文档内的实时报文信息,并通过所述自动分词标注模型对所述实时报文信息进行分词处理和标注处理,以获取所述实时报文信息的实时报文体;
提取所述实时报文体中的请求参数、返回参数以及IP地址;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010254667.X/2.html,转载请声明来源钻瓜专利网。