[发明专利]一种基于用户对话历史的个性化对话生成方法和系统在审
申请号: | 202011060186.1 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112182161A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 窦志成;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/30;G06K9/62 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 对话 历史 个性化 生成 方法 系统 | ||
本发明涉及一种基于用户对话历史的个性化对话生成方法和系统,包括以下步骤:S1将用户对话历史的文本表示为句子向量;S2通过对句子向量进行编码得到用户个性向量,用户个性向量中包含了句子向量的时序信息;S3根据用户个性向量和句子向量的时序信息生成个性化对话模型;S4将新的输入文本的词向量输入个性化对话模型生成个性化对话的回复。其使用对话历史进行用户建模,通过用户对话历史回复计算得出用户个性向量,而避免使用用户ID获取和更新个性向量,当新用户加入时,即可直接将其对话历史表示为个性向量。
技术领域
本发明涉及一种基于用户对话历史的个性化对话生成方法和系统,属于人工智能技术领域。
背景技术
伴随着由数据驱动的端到端对话系统的发展,个性化对话系统开始出现。闲聊型个性化对话系统,即是针对开放领域下输入给出合适回复的同时,输出的结果能具有人的角色信息。在应用中,无论是虚拟的社交机器人还是智能个人代理回复,都要求对话模型给出的回复具备人物角色信息,因此需要赋予模型人物设定(本文中简称为人设)来维持人物角色信息的统一。目前为个性化对话系统构建人设的方法主要分为显式人设和隐式人设两种。显式人设主要通过预先设定的属性关键词或句子描述等来作为模型个性化的人设信息,在模型输出结果时利用这些显式的文本信息来控制模型的生成或选择过程。相对地,隐式人设则没有任何显式定义的文本来作为角色信息,模型通过用户对话历史为每个用户构建隐式的个性向量,以此作为用户的人设加入到生成过程中,来维持输出结果的人设一致性。
显式人设的方法为了构建大规模与人设相关的训练数据,需要投入大量的人力资源,来模拟相关对话场景或者构造规则。而且,由于显式人设能够预先给出人设信息有限,如PERSONA-CHAT数据集中,仅用5句话作为人设信息,因此面对设定之外的输入,模型仍倾向于给出设定相关的回复,而导致了回复质量的降低。在实际应用中,面对新的人物或者新的属性设定均需要重复之前的步骤。因此,显式人设的方法只适用于固定且小规模的场景范围。对应地,隐式人设的方法则自动从对话历史中学习用户的角色信息,将用户个性化的角色信息转换为向量来表示用户的人设,通过隐式的个性向量来引导模型生成或选择个性化的回复。因此,隐式人设的方法避免了为每个用户配置人设的过程,可以在大规模的用户群体上构建用户特有的个性化对话模型,面对同样的输入根据不同用户的特点给出个性化回复,可作为用户的代理回复助手。隐式人设的方式虽然可以通过隐式的个性向量来学习用户对话历史中的人物性格和语言习惯等个性化特征。然而现有的研究工作大多从全局层面来构建用户个性向量,这样不加区别地使用用户历史,最终得到的静态个性向量包含了对话历史中用户所有的个性化特征,在面对不同的输入时,模型难以表达出用户具体某个方面的个性特征。Li等人(Piji Li,Zihao Wang,Lidong Bing,and Wai Lam.Persona-aware tips generation?In The World Wide Web Conference,pages 1006-1016,2019.)利用用户历史为每个用户构建与个性化相关的关键词,在关键词生成的不同时刻,通过注意力机制将关键词加权求得表示用户个性的个性向量,而非通过模型训练得到用户个性向量。这在一定程度上使得隐式人设从静态的向量转变为动态的向量,可以在生成的不同阶段进行调整,然而,个性化关键词的方式生成的回复仅仅能够具备角色显著的属性信息,不同角色对话时语言习惯等细微的个性化特征无法捕捉。另外,目前个性向量在训练时主要通过用户ID来进行获取并通过反向传播进行更新,随着用户的增多,每个用户历史数量在整个数据集中的占比将会减小,用户个性向量随着模型更新缓慢,新用户也无法加入已经训练好的模型中,需要重新对模型进行训练,在实际应用中,难以对用户新的历史和新用户做出及时的响应。同时,这样的方式忽略了用户对话历史中的时序信息,用户最新的角色信息在个性向量中无法得到强化。
发明内容
针对上述问题,本发明的目的是提供一种基于用户对话历史的个性化对话生成方法和系统,其使用对话历史进行用户建模,通过用户对话历史回复计算得出用户个性向量,而避免使用用户ID获取和更新个性向量,当新用户加入时,即可直接将其对话历史表示为个性向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011060186.1/2.html,转载请声明来源钻瓜专利网。