[发明专利]一种基于自然语言处理的智能运维语句相似度匹配方法在审

申请号：	201910084077.4	申请日：	2019-01-29
公开（公告）号：	CN109902159A	公开（公告）日：	2019-06-18
发明（设计）人：	后其林;李达;钟丽莉;万谊强;仵伟强;王霄琨	申请（专利权）人：	华融融通（北京）科技有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/36
代理公司：	北京慧泉知识产权代理有限公司 11232	代理人：	李娜
地址：	100032 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种基于自然语言处理技术的智能运维语句相似度匹配方法，本发明主要包括知识库构建中的数据处理、基于深度学习的句子相似度匹配两部分。与现有技术相比，优点及功效在于：(1)本发明利用特定的词库和HMM发现新词模型来对运维管理知识进行分词处理，提高了文本分词的准确性，建立更加完善的文本词库；(2)文本发明通过深度学习方法训练词向量，不仅可以避免词向量表示的“维数灾难”现象，而且能充分挖掘词汇上下文的信息，可以获取词与词之间的关系；(3)基于配置权重的句向量，不仅可以获得每个词重要度量，还可以从词向量的结合使句向量的信息变得更加丰富，利用余弦相似度匹配算法使匹配在形成句向量的基础上准确率得以保障。
搜索关键词：	匹配词向量向量语句相似度词库运维自然语言处理技术文本自然语言处理句子相似度余弦相似度知识库构建分词处理匹配算法文本分词运维管理智能数据处理准确率度量权重维数词汇学习挖掘灾难配置发现
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于自然语言处理的智能运维语句相似度匹配方法，其特征在于：该方法具体步骤如下：步骤一.知识库构建中的数据处理将非结构化的运维知识进行处理后导入到知识库，具体为：将非结构化运维知识数据批量地读取，去除特殊符号以及乱码，统一所有知识的格式，以UTF‑8进行编码；导入数据的内容包括运维问题以及针对于该问题的解决方案；最终对运维知识进行筛选处理生成文本库，为构建运维管理知识库提供基础数据；步骤二.基于深度学习的句子相似度匹配通过挖掘上一步得到的文本库，与其他语料合并形成丰富的训练语料库来构建文本库中的词向量，并根据词向量生成文本库中每条文本的句向量，根据句向量与用户输入的问题句向量进行相似度匹配，从而获取运维知识库中的信息；具体是通过贝叶斯方法和隐马尔可夫模型为基础对训练语料库进行分词得到含有运维知识的语料词库，对该语料词库利用连续词袋模型，充分挖掘词与词之间的上下文信息，输出一个二叉树来表征语料词库中的词向量，之后利用获取的词向量模型对文本库中的运维语句进行单词权重计算以及加法结合成特定语句向量，存储在运维知识库中；用户输入问题的同时计算出用户输入的特定语句向量，最后利用相似度算法从知识库中匹配出相应的运维知识，并在用户选择后给出针对该知识的解决方案。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华融融通（北京）科技有限公司，未经华融融通（北京）科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910084077.4/，转载请声明来源钻瓜专利网。

上一篇：语音交互方法、装置、计算机设备及存储介质
下一篇：电路题目自动解答的方法及系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于自然语言处理的智能运维语句相似度匹配方法在审

专利文献下载