[发明专利]一种基于多特征融合的智能客服方法及系统有效
申请号: | 202010903288.9 | 申请日: | 2020-09-01 |
公开(公告)号: | CN112052319B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 李美玲;李秀梅;孙军梅;任亚伟 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62;G06F40/247;G06F40/289;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
地址: | 311121 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 融合 智能 客服 方法 系统 | ||
1.一种基于多特征融合的智能客服方法,其特征在于:步骤一、建立语料库和用户询问数据集;语料库中含有客服所需的问答信息;将语料库中提取出多个语义相同的语句对和多个语义不同的语句对,组成用户询问数据集;
步骤二、对语料库中的语句进行预处理;预处理中包括中文分词,以得到词汇表;
步骤三、模型建立和训练
3-1.搭建相似度识别模块
相似度识别模块包括预处理层、特征提取模块、特征融合层、分类层和输出层;所述的预处理层用于对用户输入的提问语句S1进行包括中文分词在内的预处理操作;所述的特征提取模块包括语义特征模块和词形特征模块;语义特征模块用于对提问语句S1和语料库语句S2组成的语句对进行语义特征提取,得到语义特征矩阵;词形特征模块用于对提问语句S1和语料库语句S2组成的语句对进行词形特征提取,得到词形特征矩阵;特征融合层将语句对的词形特征矩阵和语义特征矩阵横向拼接,形成融合特征矩阵;分类层用于根据融合特征矩阵进行相似度判断,获得提问语句S1与语料库语句S2是否同义的判断结果;
语义特征模块获取语义特征矩阵的过程如下:所述的语义特征模块包括词向量嵌入层、网络编码层、注意力交互层、语义特征融合层;用户提问语句S1和一个语料库语句S2分别经过词向量嵌入层将语句中的各个词映射为对应的词向量,每个词向量均对应一个位置向量;位置向量表示对应的词在词库中的位置;词向量与对应的位置向量的维度相同;将各个词向量分别与对应的位置向量横向拼接在一起,得到带位置信息的特征词向量;
所述的网络编码层中设置有LSTM网络、Bi-LSTM网络和CNN网络;由用户提问语句S1和一个语料库语句S2得到的带位置信息的特征词向量进入网络编码层后,各自在LSTM网络和Bi-LSTM网络中进行全局语义特征编码;将用户提问语句S1和一个语料库语句S2经过LSTM网络编码后的输出结果进行点乘后,送入CNN网络提取用户提问语句S1与语料库语句S2之间的相似特征信息,得到CNN相似矩阵;
运用多头注意力机制分别获得用户提问语句S1、语料库语句S2的多头注意力;用户提问语句S1、语料库语句S2的多头注意力进行全局平均池化后经过余弦相似度和曼哈顿相似度两个特征提取方法获取深层语义特征,获得余弦相似矩阵和曼哈顿相似矩阵;将用户提问语句S1、语料库语句S2经Bi-LSTM网络编码后的输出结果经过乘法、减法、最大值特征提取方法,获得乘法提取矩阵、减法提取矩阵和最大值提取矩阵;
将根据用户提问语句S1和语料库语句S2获取的CNN相似矩阵、余弦相似矩阵、曼哈顿相似矩阵、乘法提取矩阵、减法提取矩阵和最大值提取矩阵横向拼接,获得语义特征矩阵;
所述的词形特征模块获取词形特征矩阵的具体过程如下:使用N-Gram算法、最小编辑距离算法和Jaccard相似度方法分别对提问语句S1和语料库语句S2进行处理,分别得到N-gram相似度矩阵、编辑距离相似度矩阵和Jaccard相似度矩阵,将所得的该三个矩阵横向拼接,获得三特征融合的词形特征矩阵;
3-2.模型训练
将用户询问数据集输入到步骤3-1记载的相似度识别模块中进行训练;使得训练后的相似度识别模块能够对用户输入的语句与语料库中的各个语句进行相似度计算;
步骤四、使用者将需要解答的用户提问语句S1输入到相似度识别模块中;并逐个将语料库内的语句作为语料库语句S2输入训练后的相似度识别模块中各自进行相似度计算;并根据所得相似度判断用户提问语句S1与各个语料库语句S2是否同义;当语料库内的一个语句与用户提问语句S1同义时,将该语句对应的答复信息推送给使用者。
2.根据如权利要求1所述的一种基于多特征融合的智能客服方法,其特征在于:步骤3-1中获取语句的多头注意力的过程如下:语句的多头注意力计算过程如式(1)、(2)、(3)所示;
(1)
其中;为被计算语句的多头注意力;为第
(2)
其中;矩阵Q、K、V相同,均为LSTM网络的语义基础矩阵;表示注意力计算函数,以Q、K、V为变量的表达式如式(3)所示;
(3)
其中;为softmax激活函数运算;分别第i个子空间的三个权重系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010903288.9/1.html,转载请声明来源钻瓜专利网。