[发明专利]基于意图门的任务型多轮对话方法及系统在审
申请号: | 202111193760.5 | 申请日: | 2021-10-13 |
公开(公告)号: | CN114036268A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 朱亚杰;卢宏涛 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/36;G06N5/04 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 李佳俊;郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 意图 任务 轮对 方法 系统 | ||
1.一种基于意图门的任务型多轮对话方法,其特征在于,包括:
步骤S1:根据业务需求收集相应用户语料并进行预处理;
步骤S2:根据所述用户语料定义相应意图、词槽和意图门标签;
步骤S3:训练和优化意图识别模型、词槽语义填充模型和意图门模型;
步骤S4:对意图识别模型、词槽语义填充模型和意图门模型进行推理;
步骤S5:通过意图识别模型和词槽语义填充模型识别该用户语料的意图和提取相应词槽,若词槽已填完,通过当前意图调用相应的信源服务作出回复;
若词槽未填完,则进行多轮任务直至所有词槽填完。
2.根据权利要求1所述的基于意图门的任务型多轮对话方法,其特征在于,所述步骤S1中用户语料是通过生产环境进行收集的,所述预处理包括清洗脏乱差和没有实际语义的用户语料。
3.根据权利要求1所述的基于意图门的任务型多轮对话方法,其特征在于,所述步骤S2包括:
步骤S2.1:定义意图、词槽和意图门标签,通过用户语料知道这些语料所对应的领域,结合业务需求定义相应意图、词槽和意图门标签;
步骤S2.2:标注意图、词槽和意图门。
4.根据权利要求1所述的基于意图门的任务型多轮对话方法,其特征在于,所述步骤S3包括:
步骤S3.1:训练意图识别、词槽语义填充和意图门模型:将每个领域的语料按照8:1:1的比例进行划分,再把每个领域语料的8份作为训练集,每个领域语料的1份作为验证集,另每个领域语料的1份作为测试集;
步骤S3.2:优化意图识别、词槽语义填充和意图门模型:通过所述测试集的结果,分析该模型对每个领域语料识别效果,从语料、算法和参数迭代优化该模型。
5.根据权利要求1所述的基于意图门的任务型多轮对话方法,其特征在于,所述步骤S5包括:
步骤S5.1:通过意图识别模型和词槽语义填充模型识别该用户语料的意图和提取相应词槽,若词槽已填完,通过当前意图调用相应的信源服务作出回复;
若词槽未填完,则进行多轮任务直至所有词槽填完,再根据当前意图调用相应的信源服务作出回复;
步骤S5.2:通过追问的方式根据缺少的词槽询问相应词槽,当用户继续填词槽时,需要通过意图门模型判别当前的意图和原意图是否一致,若一致,则继续填词槽,循环下去直至所有词槽填完,再根据当前任务调用相应的信源服务作出回复;
若不一致则需要切换新任务。
6.一种基于意图门的任务型多轮对话系统,其特征在于,包括:
模块M1:根据业务需求收集相应用户语料并进行预处理;
模块M2:根据所述用户语料定义相应意图、词槽和意图门标签;
模块M3:训练和优化意图识别模型、词槽语义填充模型和意图门模型;
模块M4:对意图识别模型、词槽语义填充模型和意图门模型进行推理;
模块M5:通过意图识别模型和词槽语义填充模型识别该用户语料的意图和提取相应词槽,若词槽已填完,通过当前意图调用相应的信源服务作出回复;
若词槽未填完,则进行多轮任务直至所有词槽填完。
7.根据权利要求6所述的基于意图门的任务型多轮对话系统,其特征在于,所述模块M1中用户语料是通过生产环境进行收集的,所述预处理包括清洗脏乱差和没有实际语义的用户语料。
8.根据权利要求6所述的基于意图门的任务型多轮对话系统,其特征在于,所述模块M2包括:
模块M2.1:定义意图、词槽和意图门标签,通过用户语料知道这些语料所对应的领域,结合业务需求定义相应意图、词槽和意图门标签;
模块M2.2:标注意图、词槽和意图门。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111193760.5/1.html,转载请声明来源钻瓜专利网。