[发明专利]一种基于自然语言处理的可视化数据接口通用解析方法有效
申请号: | 201811531079.5 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109684395B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 朱邱悦 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F40/151;G06F40/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 可视化 数据 接口 通用 解析 方法 | ||
本发明提供一种基于自然语言处理的可视化数据接口通用解析方法,属于数据交互技术领域,本发明通过自然语言处理方法,建立数据接口信息识别模型,从而在接口开发方提供的接口信息载体中识别出数据接口信息;再利用自然语言处理模型,实现数据接口返回数据接收表的自动创建,数据接口参数与返回数据接收表字段的自动匹配;最后通过可视化方法将数据接口解析过程展现出来,通过人工校正和在线测试的方式,完成数据接口的解析。避免不同数据接口解析的重复代码编写,减少数据接口解析错误,提高数据接口解析的便利性、准确性和时效性。
技术领域
本发明涉及数据交互技术,尤其涉及一种基于自然语言处理的可视化数据接口通用解析方法。
背景技术
Web数据接口系统数据交互的常用方式。数据接口的解析工作是指分析数据接口的调用方式和返回数据格式等信息,实现将调用的数据接口返回数据存储入库的功能。
通常其过程如下:首先,研究接口信息载体中的功能介绍、接口地址、输入参数、返回数据等说明;然后,根据数据接口的输入参数,编写数据接口调用方法;最后,解析数据接口返回数据格式,进行接收表的手动创建,人工匹配接口返回数据与接收数据表字段的对应关系,编写代码将接口返回数据存储入库。
但是,通常的数据接口解析方法需要根据接口信息载体,手动建立接口数据接收表,人工匹配接口返回数据与接收数据表字段的对应关系,每解析一个数据接口,需要重新编写一次数据解析代码,尤其是数据接口比较复杂时,接口信息载体的研究、代码编写和调试费时费力,且容易出现参数解析错误。
发明内容
为了解决以上技术问题,本发明提出了一种基于自然语言处理的可视化数据接口通用解析方法,采用可视化手段解析数据接口调用参数和返回数据等信息的通用方法,实现不同类型数据接口解析的自动化、智能化,避免不同数据接口解析的重复代码编写,减少数据接口解析错误,提高数据接口解析的便利性、准确性和时效性。
本发明采用的技术方案是:
一种基于自然语言处理的可视化数据接口通用解析方法,主要过程为:
通过语义依存、短文本相似等自然语言处理方法,建立数据接口信息识别模型,从而在接口开发方提供的接口信息载体中识别出数据接口信息;再利用语义分析、汉字转换等自然语言处理模型,实现数据接口返回数据接收表的自动创建,数据接口参数与返回数据接收表字段的自动匹配;最后通过可视化方法将数据接口解析过程展现出来,通过人工校正和在线测试的方式,完成数据接口的解析。
进一步的包括,
主要包括如下步骤:
步骤1、基于海量的数据接口开发方提供的接口信息,组建自然语言处理语料库,进行自然语言处理训练,通过机器学习,完善数据接口信息识别模型。
信息识别模型定义的规则为将接口参数信息描述识别为标准参数名称,即系统能识别的中文汉字。
步骤2、采用步骤1中的数据接口信息识别模型识别要解析的数据接口信息,提取出数据接口的接口说明、接口地址、接口类型、调用参数和返回数据等内容。
步骤3、在可视化操作页面上展示步骤2中提取的接口信息,包括接口说明、接口地址、接口类型、调用参数和返回数据参数,可以进行人工校正确认。
调用参数和返回数据参数如果为多个,按顺序依次在页面展示。
步骤4、以数据接口调用参数和返回数据的参数名称、参数值和中文说明的关联关系建立语义分析模型,通过大量语料库的不断训练,实现参数名称、参数值和中文说明语义分析结果的相互校正,最终给出某个参数的中文推荐解释。
语义分析规则为将数据接口参数名称、参数值和中文说明语义分析结果趋于标准一致的参数名称,即系统能识别的中文汉字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811531079.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本生成方法、装置、设备和存储介质
- 下一篇:全球KYC实时查询系统