[发明专利]一种基于自然语言处理的可视化数据接口通用解析方法有效
申请号: | 201811531079.5 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109684395B | 公开(公告)日: | 2023-02-10 |
发明(设计)人: | 朱邱悦 | 申请(专利权)人: | 浪潮软件集团有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F40/151;G06F40/30 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自然语言 处理 可视化 数据 接口 通用 解析 方法 | ||
1.一种基于自然语言处理的可视化数据接口通用解析方法,其特征在于,
先通过自然语言处理方法,建立数据接口信息识别模型,从而在接口开发方提供的接口信息载体中识别出数据接口信息;
再利用自然语言处理模型,实现数据接口返回数据接收表的自动创建,数据接口参数与返回数据接收表字段的自动匹配;
最后通过可视化方法将数据接口解析过程展现出来,通过人工校正和在线测试的方式,完成数据接口的解析;
所述的返回数据接收表建表方式包括中英转换、汉字拼音转换、拼音首字母转的汉字转换规则;
主要包括如下步骤:
步骤1)、基于海量的数据接口开发方提供的接口信息,组建自然语言处理语料库,进行自然语言处理训练,通过机器学习,完善数据接口信息识别模型;
步骤2)、采用步骤1)中的数据接口信息识别模型识别要解析的数据接口信息,提取出数据接口的接口说明、接口地址、接口类型、调用参数和返回数据;
步骤3)、在可视化操作页面上展示步骤2)中提取的接口信息,包括接口说明、接口地址、接口类型、调用参数和返回数据参数,进行人工校正确认;
步骤4)、以数据接口调用参数和返回数据的参数名称、参数值和中文说明的关联关系建立语义分析模型,通过大量语料库的不断训练,实现参数名称、参数值和中文说明语义分析结果的相互校正,最终给出某个参数的中文推荐解释步骤;
步骤5)、基于自然语言处理的通用语料库训练,建立中英转换、汉字拼音转换、拼音首字母转换模型;
步骤6)、在数据库中建立数据接口返回数据接收表;
步骤7)、建立数据接口调用参数、返回数据参数和返回数据接收表字段的对应关系;
步骤8)、在可视化操作页面上,进行接口解析的在线测试,填写接口调用条件,显示接口调用结果和接口调用错误提示,完成数据接口解析的测试工作。
2.根据权利要求1所述的方法,其特征在于,
在步骤1)中,自然语言处理训练规则为将接口参数信息描述识别为标准参数名称,即系统能识别的中文汉字。
3.根据权利要求1所述的方法,其特征在于,
在步骤2)中,调用参数和返回数据参数如果为一个以上,按顺序依次在页面展示。
4.根据权利要求1所述的方法,其特征在于,
在步骤4中),语义分析训练规则为将数据接口参数名称、参数值和中文说明语义分析结果趋于标准一致,即系统能识别的中文汉字。
5.根据权利要求1所述的方法,其特征在于,
在步骤6)中,
首先,指定数据库建表方式;
其次,根据步骤4)中语义分析出的参数推荐解释和步骤5)中的建表方式的汉字转换模型,在可视化操作页面上,显示自动创建的数据表字段,人工校正确认后,实现返回数据接收表的自动创建。
6.根据权利要求1所述的方法,其特征在于,
在步骤7)中,在可视化操作页面上展示的调用参数、返回数据参数和数据库返回数据接收表字段的一一对应关系,人工校正后,完成数据接口的解析工作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件集团有限公司,未经浪潮软件集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811531079.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本生成方法、装置、设备和存储介质
- 下一篇:全球KYC实时查询系统