[发明专利]一种基于自然语言处理的智能运维语句相似度匹配方法在审
申请号: | 201910084077.4 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109902159A | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 后其林;李达;钟丽莉;万谊强;仵伟强;王霄琨 | 申请(专利权)人: | 华融融通(北京)科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36 |
代理公司: | 北京慧泉知识产权代理有限公司 11232 | 代理人: | 李娜 |
地址: | 100032 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于自然语言处理技术的智能运维语句相似度匹配方法,本发明主要包括知识库构建中的数据处理、基于深度学习的句子相似度匹配两部分。与现有技术相比,优点及功效在于:(1)本发明利用特定的词库和HMM发现新词模型来对运维管理知识进行分词处理,提高了文本分词的准确性,建立更加完善的文本词库;(2)文本发明通过深度学习方法训练词向量,不仅可以避免词向量表示的“维数灾难”现象,而且能充分挖掘词汇上下文的信息,可以获取词与词之间的关系;(3)基于配置权重的句向量,不仅可以获得每个词重要度量,还可以从词向量的结合使句向量的信息变得更加丰富,利用余弦相似度匹配算法使匹配在形成句向量的基础上准确率得以保障。 | ||
搜索关键词: | 匹配 词向量 向量 语句相似度 词库 运维 自然语言处理技术 文本 自然语言处理 句子相似度 余弦相似度 知识库构建 分词处理 匹配算法 文本分词 运维管理 智能 数据处理 准确率 度量 权重 维数 词汇 学习 挖掘 灾难 配置 发现 | ||
【主权项】:
1.一种基于自然语言处理的智能运维语句相似度匹配方法,其特征在于:该方法具体步骤如下:步骤一.知识库构建中的数据处理将非结构化的运维知识进行处理后导入到知识库,具体为:将非结构化运维知识数据批量地读取,去除特殊符号以及乱码,统一所有知识的格式,以UTF‑8进行编码;导入数据的内容包括运维问题以及针对于该问题的解决方案;最终对运维知识进行筛选处理生成文本库,为构建运维管理知识库提供基础数据;步骤二.基于深度学习的句子相似度匹配通过挖掘上一步得到的文本库,与其他语料合并形成丰富的训练语料库来构建文本库中的词向量,并根据词向量生成文本库中每条文本的句向量,根据句向量与用户输入的问题句向量进行相似度匹配,从而获取运维知识库中的信息;具体是通过贝叶斯方法和隐马尔可夫模型为基础对训练语料库进行分词得到含有运维知识的语料词库,对该语料词库利用连续词袋模型,充分挖掘词与词之间的上下文信息,输出一个二叉树来表征语料词库中的词向量,之后利用获取的词向量模型对文本库中的运维语句进行单词权重计算以及加法结合成特定语句向量,存储在运维知识库中;用户输入问题的同时计算出用户输入的特定语句向量,最后利用相似度算法从知识库中匹配出相应的运维知识,并在用户选择后给出针对该知识的解决方案。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华融融通(北京)科技有限公司,未经华融融通(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910084077.4/,转载请声明来源钻瓜专利网。