[发明专利]话术模型训练方法、对话信息生成方法及装置、系统在审
申请号: | 202010442462.4 | 申请日: | 2020-05-22 |
公开(公告)号: | CN111611382A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 王宏;王贺青;王文彬;武晓飞;梁杰;汪洁;田育珍 | 申请(专利权)人: | 贝壳技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 300457 天津市滨海新区经济技术开发*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 对话 信息 生成 装置 系统 | ||
1.一种话术模型训练方法,其特征在于,所述方法包括:
获取用户问题与对应的经纪人回答信息记录;
根据所述用户问题训练生成文本分类模型,并根据所述文本分类模型获取与所述用户问题对应的用户询问意图;
根据所述对应的经纪人回答信息记录获取回答信息特征,并根据所述回答信息特征训练聚类模型;
根据所述用户询问意图与所述聚类模型,生成话术模型。
2.如权利要求1所述的方法,其特征在于,所述获取用户问题与对应的经纪人回答信息记录,包括:
获取用户问题与经纪人回答信息的历史数据;
根据所述历史数据整理用户问题与经纪人回答信息的对应关系;
根据所述对应关系将用户问题与经纪人回答信息对应。
3.如权利要求1所述的方法,其特征在于,所述根据所述用户问题训练生成文本分类模型,包括:
根据用户问题抽取用户意图分类标签;
根据所述用户问题和用户意图分类标签,将用户问题和用户意图分类标签配置成一条样本;
抽取设定量级的所述样本构成训练数据,利用训练数据训练文本分类模型;所述文本分类模型能够根据用户问题识别对应的用户询问意图。
4.如权利要求3所述的方法,其特征在于,所述利用训练数据训练文本分类模型,包括:
将所述训练数据输入fasttext快速文本分类模型;
利用所述fasttext快速文本分类模型,对所述训练数据中的用户问题和用户意图分类标签进行分类,生成用户问题与用户询问意图的对应。
5.如权利要求1所述的方法,其特征在于,所述根据所述对应的经纪人回答信息记录获取回答信息特征,进一步包括:
根据所述用户问题与经纪人回答信息的对应关系,从所述经纪人回答信息记录中获取与所述用户问题对应的经纪人回答信息;
根据所述经纪人回答信息,抽取回答信息特征;
根据所述用户问题训练生成的文本分类模型,将所述用户询问意图与对应的回答信息特征对应。
6.一种对话信息生成方法,其特征在于,采用如权利要求1~5任一所述的话术模型,所述方法包括:
获取用户输入的用户问题,并识别用户询问意图;
根据所述用户询问意图,调用所述话术模型,生成回答话术模板。
7.一种话术模型训练装置,其特征在于,所述装置包括:
历史数据获取单元,用于获取用户问题与对应的经纪人回答信息记录;
文本分类模型单元,用于根据所述用户问题训练生成文本分类模型,并根据所述文本分类模型获取与所述用户问题对应的用户询问意图;
聚类模型单元,用于根据所述对应的经纪人回答信息记录获取回答信息特征,并根据所述回答信息特征训练聚类模型;
话术模型单元,用于根据所述用户询问意图与所述聚类模型,生成话术模型。
8.一种对话信息生成系统,其特征在于,采用如权利要求7所述的话术模型训练装置训练生成的话术模型,具体包括:
用户询问意图获取单元,用于获取用户输入的用户问题,并识别用户询问意图;
回答话术生成单元,用于根据所述用户询问意图,调用所述话术模型,生成回答话术模板。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序用于执行上述权利要求1-6任一所述的方法。
10.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-6任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贝壳技术有限公司,未经贝壳技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010442462.4/1.html,转载请声明来源钻瓜专利网。