[发明专利]一种融合用户满意度的任务导向型对话策略学习方法在审
申请号: | 202210738419.1 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115344667A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 王振宇;张睿 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F40/30;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种融合用户满意度的任务导向型对话策略学习方法。所述方法包括以下步骤:收集人机对话数据并结合任务场景进行数据清洗;提取出对话中的意图、槽值和情绪状态信息,并进行向量化表示;构建对话策略模块;构建情感策略模块;构建加权融合模块,获取候选响应动作对应的聚合动作价值与动作情感价值的总得分,并根据总得分预测响应动作;获取预测的响应动作后的对话状态、奖励和用户真实情绪状态信息,优化对话策略模块和情感策略模块的网络参数。本发明充分考虑了对话和情感状态的特征,通过融合深度强化学习和监督学习技术,兼顾对话效率和用户满意度目标,提高了对话策略模型的效果。 | ||
搜索关键词: | 一种 融合 用户 满意 任务 导向 对话 策略 学习方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210738419.1/,转载请声明来源钻瓜专利网。