[发明专利]一种基于NLP算法的预警处理方法及系统在审
申请号: | 202011280858.X | 申请日: | 2020-11-16 |
公开(公告)号: | CN112269568A | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 姜坤 | 申请(专利权)人: | 加和(北京)信息科技有限公司 |
主分类号: | G06F8/30 | 分类号: | G06F8/30;G06F8/41;G06F21/56 |
代理公司: | 深圳市朝闻专利代理事务所(普通合伙) 44454 | 代理人: | 谭育华 |
地址: | 100026 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 nlp 算法 预警 处理 方法 系统 | ||
1.一种基于NLP算法的预警处理方法,其特征在于,包括:
获取报错信息;
收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;
将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;
输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;
输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。
2.根据权利要求1所述的方法,其特征在于,所述将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码,包括:
对于所述报错信息的相关程序源代码中的扩展源代码执行宏替换操作;
启动编译器通过汇编语言将源代码编译成可执行二进制代码。
3.根据权利要求1所述的方法,其特征在于,在输入所述编码后的代码数据到预设NLP算法模型中进行深度学习之前,所述方法还包括:
训练预设NLP算法模型,所述预设NLP算法模型用于采用code2vec神经网络的部分读取代码向量。
4.根据权利要求3所述的方法,其特征在于,所述输入所述编码后的代码数据到预设NLP算法模型中进行深度学习,包括:
获取一种新方法;
通过所述code2vec神经网络将所述新方法的下上文路径样本输入到预设NLP算法模型中进行深度学习。
5.根据权利要求1所述的方法,其特征在于,所述输出进行深度学习并且解码代码数据后的自然语言,包括:
将进行深度学习后的代码进行解码;
输出解码后的自然语言。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
结合静态程序和动态程序分析所述报错信息中源代码运行发生的代码功能以及代码各种类型的数据。
7.一种基于NLP算法的预警处理系统,其特征在于,包括:
获取单元,用于获取报错信息;
收集单元,用于收集所述报错信息的相关程序源代码,所述源代码包括多种类型的表示形式,所述表示形式提供了进行代码结构的唯一窗口;
编码单元,用于将所述报错信息的相关程序源代码数据进行编码成可执行二进制代码;
输入单元,用于输入所述编码后的代码数据到预设NLP算法模型中进行深度学习;
输出单元,用于输出进行深度学习并且解码代码数据后的自然语言,所述自然语言提供了所述报错信息所需的代码含义和行为的线索。
8.根据权利要求7所述的系统,其特征在于,所述编码单元包括:
执行模块,用于对于所述报错信息的相关程序源代码中的扩展源代码执行宏替换操作;
启动模块,用于启动编译器通过汇编语言将源代码编译成可执行二进制代码。
9.根据权利要求7所述的系统,其特征在于,在所述输入单元之前,所述系统还包括:
训练单元,用于训练预设NLP算法模型,所述预设NLP算法模型用于采用code2vec神经网络的部分读取代码向量。
10.根据权利要求9所述的系统,所述输入单元包括:
获取模块,用于获取一种新方法;
输入模块,用于通过所述code2vec神经网络将所述新方法的下上文路径样本输入到预设NLP算法模型中进行深度学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于加和(北京)信息科技有限公司,未经加和(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011280858.X/1.html,转载请声明来源钻瓜专利网。