[发明专利]对话文本的分类方法和电子设备在审
申请号: | 201911344249.3 | 申请日: | 2019-12-24 |
公开(公告)号: | CN113032534A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 李丹;苟浩淞;杨兵;伍雄 | 申请(专利权)人: | 中国移动通信集团四川有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/211;G06F40/30 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 文本 分类 方法 电子设备 | ||
本说明书实施例公开了一种对话文本的分类方法和电子设备,用于提高对话文本的分类效率。该方法包括:获取对话文本;通过多层次自注意力机制的编码器对对话文本进行编码,得到对话文本的文档向量;计算文档向量分别与多个原型网络的向量距离;其中,上述多个原型网络对应多个类别,上述多个原型网络是基于类别已经确定的样本对话文本训练得到;基于计算得到的向量距离以及上述多个原型网络的类别,确定对话文本的类别。
技术领域
本文件涉及人工智能技术领域,尤其涉及一种对话文本的分类方法和电子设备。
背景技术
服务提供方通过客服渠道能够快速获取用户的意见和建议。客服渠道对于服务提供方实时了解所提供的服务质量,并有针对性的提升部分服务具有重大的意义。
服务提供方通过客服渠道可以获取到客服人员与用户之间的对话文本,通过对对话文本进行分类,可以快速确定出对话文本的关键信息,如问题类型,问题场景等等,能够极大的提升服务提供方的服务质量。
然而,相关技术中通常是依靠客服人员人工来对大量的对话文本进行分类,存在工作量大、效率低的问题。因此,有必要提供一种高效的对话文本的分类方法。
发明内容
本说明书实施例提供一种对话文本的分类方法和电子设备,用于提高对话文本的分类效率。
本说明书实施例采用下述技术方案:
第一方面,提供了一种对话文本的分类方法,包括:
获取对话文本;
通过多层次自注意力机制的编码器对所述对话文本进行编码,得到所述对话文本的文档向量;
计算所述文档向量分别与多个原型网络的向量距离;其中,所述多个原型网络对应多个类别,所述多个原型网络是基于类别已经确定的样本对话文本训练得到;
基于计算得到的向量距离以及所述多个原型网络的类别,确定所述对话文本的类别。
第二方面,提供了一种提供了一种对话文本的分类方法,包括:
获取类别已经确定的样本对话文本;
基于所述样本对话文本及所述类别进行模型训练以得到原型网络;
其中,所述原型网络用于基于目标文档向量与所述原型网络的向量距离,预测目标对话文本的类别;所述目标文档向量是通过多层次自注意力机制的编码器对所述目标样本对话文本进行编码得到的。
第三方面,提供了一种电子设备,包括:
文本获取模块,用于获取对话文本;
向量得到模块,用于通过多层次自注意力机制的编码器对所述对话文本进行编码,得到所述对话文本的文档向量;
距离计算模块,用于计算所述文档向量分别与多个原型网络的向量距离;其中,所述多个原型网络对应多个类别,所述多个原型网络是基于类别已经确定的样本对话文本训练得到;
类别确定模块,用于基于计算得到的向量距离以及所述多个原型网络的类别,确定所述对话文本的类别。
第四方面,提供了一种电子设备,包括:
文本获取模块,用于获取类别已经确定的样本对话文本;
模型训练模块,用于基于所述样本对话文本及所述类别进行模型训练以得到原型网络;
其中,所述原型网络用于基于目标文档向量与所述原型网络的向量距离,预测目标对话文本的类别;所述目标文档向量是通过多层次自注意力机制的编码器对所述目标样本对话文本进行编码得到的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团四川有限公司;中国移动通信集团有限公司,未经中国移动通信集团四川有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911344249.3/2.html,转载请声明来源钻瓜专利网。