[发明专利]客服问答数据的处理方法、装置、系统及电子设备在审
申请号: | 202210181479.8 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114691846A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 陈勇达;刘旭生;赵伟;刘芳;王晨飞;唐振营;安业腾;穆松鹤;李敏 | 申请(专利权)人: | 国家电网有限公司客户服务中心;浙江省北大信息技术高等研究院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06K9/62 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 支宇鑫 |
地址: | 300309 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客服 问答 数据 处理 方法 装置 系统 电子设备 | ||
1.一种客服问答数据的处理方法,其特征在于,包括:
获取用户输入的问题文本;
将所述问题文本经过文本预处理后得到预处理问题文本;
将所述预处理问题文本输入已训练好的客服问答数据处理模型,获取所述预处理问题文本与问答数据库中的每个参考问题文本之间的相似度,所述客服问答数据处理模型为无监督学习模型,所述问答数据库包括经过客服问答数据处理模型训练好的问答数据集;
将所述问答数据库中与所述预处理问题文本相似度最高的参考问题文本作为目标问题文本,输出所述目标问题文本对应的答案。
2.根据权利要求1所述的方法,其特征在于,通过如下步骤获取所述客服问答数据处理模型:
构建问答数据库;
将所述问答数据库中的测试问题文本集进行所述文本预处理,得到客服问答模型的目标训练集;
将所述目标训练集中的每个问题文本依次输入至预训练的语言表征模型,得到所述每个问题文本对应的嵌入向量集,其中,所述嵌入向量集包括问题文本的每个字的嵌入向量;
将所述嵌入向量集通过线性变换,得到目标嵌入向量集;其中,所述目标嵌入向量集中每个向量的维度小于嵌入向量集中每个向量的维度;
基于所述目标嵌入向量集,确定测试问题文本集中的测试问题文本与验证问题文本集中每个验证问题文本之间的相似度;其中,所述问答数据库包括所述验证问题文本集。
3.根据权利要求2所述的方法,其特征在于,所述将所述问答数据库中的问题文本集进行文本预处理,得到客服问答模型的目标训练集,包括:
对于问题文本集中的每个问题文本,执行以下操作:
删除当前问题文本中的第一类型的字符,得到中间问题文本;
将所述中间问题文本进行补零处理,得到目标长度的问题文本;其中,所述目标训练集包括所述目标长度的问题文本。
4.根据权利要求3所述的方法,其特征在于,所述每个问题文本对应的嵌入向量集通过如下公式来表示:
wk∈R1×D;
其中,senti表示第i个问题文本的嵌入向量集,wk表示第k个字符的嵌入向量,lmax表示所述目标长度,R表示向量空间,D代表向量的维度;
将所述嵌入向量集中的每个字符的嵌入向量做如下变换,使每个字符的嵌入向量的均值为零,其中,每个字符的嵌入向量的协方差矩阵为单位阵:
其中,为经过线性变换后的第k个字符的嵌入向量;μ为线性变换的偏置参数,wi表示第i个字符的嵌入向量,W为线性变换的权重矩阵,D'代表降维后的向量的维度。
5.根据权利要求4所述的方法,其特征在于,所述线性变换的权重矩阵W,通过以下步骤来获取:
通过如下公式确定字符向量wk的协方差矩阵:
其中,T表示当前矩阵的转置矩阵;
将协方差矩阵Σ进行变换使WTΣW=I,其中,I表示单位矩阵;
进一步得到公式:Σ=(WT)-1W-1=(W-1)TW-1;
通过如下公式对所述矩阵Σ进行奇异值分解:
Σ=UΛUT;
其中,U为正交矩阵,Λ为正对角矩阵;
基于公式通过如下公式对该矩阵求逆确定出权重矩阵W:
W∈RD×D'。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司客户服务中心;浙江省北大信息技术高等研究院,未经国家电网有限公司客户服务中心;浙江省北大信息技术高等研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210181479.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置