[发明专利]对话的意图分类方法及设备和生成意图分类模型的方法在审

申请号：	201911251188.6	申请日：	2019-12-09
公开（公告）号：	CN113033160A	公开（公告）日：	2021-06-25
发明（设计）人：	宋凯嵩;林君;孙常龙;赵露君;康杨杨;刘晓钟;张琼	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G06F40/151	分类号：	G06F40/151;G06F40/279;G06F16/35
代理公司：	北京安信方达知识产权代理有限公司 11262	代理人：	李丹;栗若木
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	对话意图分类方法设备生成模型
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种对话的意图分类方法和装置，本申请的输入意图分类模型的信息除了分词文本，还包括分词拼音文本，这样，由于表示该词的信息中还包括正确的拼音成分，增加了该词对应的准确度，为获得更好的意图分类性能提供了保障。在一种示例性实例中，本申请通过自注意机制和/或互注意机制，获得了更好的文本表示，从而获得了更好的意图分类性能。

技术领域

本申请涉及但不限于语音处理技术，尤指一种对话的意图分类方法及设备和生成意图分类模型的方法。

背景技术

对话的意图分类在语音处理中具有非常重要的应用价值。如果没有好的意图分类性能，需要大量的人工处理工作，造成人工成本的增加，从而降低工作效率。

发明内容

本申请提供一种对话的意图分类方法及设备和生成意图分类模型的方法，能够获得更好的意图分类性能。

本发明实施例提供了一种对话的意图分类方法，包括：

将对话对应的第一分词文本转换为第一分词拼音文本，将对话对应的第二分词文本转换为第二分词拼音文本；

将第一分词文本、第二分词文本、第一分词拼音文本和第二分词拼音文本输入预先训练的意图分类模型对所述对话进行意图类别识别；其中，意图分类模型根据包括文本对的对话样本集生成。

在一种示例性实例中，所述方法之前还包括：

对文本对中的第一文本进行分词处理获取所述第一分词文本，对文本对中的第二文本进行分词处理获取所述第二分词文本；

其中，第一文本为所述对话对应的文本对中的问题文本，第二文本为所述对话对应的文本对中的答复文本。

在一种示例性实例中，所述方法之前还包括：

将包括文本对的对话样本集作为训练数据输入预先构建的算法模型，训练得到对对话进行意图分类的所述意图分类模型；其中，文本对的对话样本集包括：第一分词文本、第二分词文本，以及第一分词拼音文本、第二分词拼音文本。

在一种示例性实例中，所述将第一分词文本、第二分词文本、第一分词拼音文本和第二分词拼音文本输入预先训练的意图分类模型进行意图类别识别，包括：

对所述第一分词文本和所述第一分词拼音文本分别进行处理得到每个词语对应的词向量和每个拼音对应的拼音向量，拼接对应每个词语的词向量和拼音向量作为该词的表示向量；对所述第二分词文本和所述第二分词拼音文本分别进行处理得到每个词语对应的词向量和每个拼音对应的拼音向量，拼接对应每个词语的词向量和拼音向量作为该词语的表示向量；

对所述第一分词文本和所述第一分词拼音文本对应的表示向量进行编码得到第一隐含向量，对所述第二分词文本和所述第二分词拼音文本对应的表示向量进行编码得到第二隐含向量；

根据得到的隐含向量，获取所述第一分词文本和所述第一分词拼音文本的自向量表示，以及所述第二分词文本和所述第二分词拼音文本的自向量表示，以获得每个文本对的向量表示；

拼接获得的向量表示，将拼接得到的输出向量输入所述意图分类模型进行意图类别预测，得到意图分类结果。

在一种示例性实例中，所述得到每个词语对应的词向量和每个拼音对应的拼音向量，包括：

通过查询预先训练的词向量矩阵获得所述每个词语对应的词向量；

通过查询预先训练的拼音向量矩阵来获得所述每个词语的拼音向量。

在一种示例性实例中，得到所述第一隐含向量或所述第二隐含向量，包括：

针对所述表示向量，分别从前往后以及从后往前两个方向分别获取前向隐含向量和后向隐含向量；

将对应位置向量拼接得到对应的隐含向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司，未经阿里巴巴集团控股有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】