[发明专利]一种基于长短时记忆信息的个性化对话生成方法和系统有效
申请号: | 202010927235.0 | 申请日: | 2020-09-07 |
公开(公告)号: | CN112115247B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 窦志成;李小禾 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G06N3/0455;G06N3/0442;G06N3/08 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 短时记忆 信息 个性化 对话 生成 方法 系统 | ||
1.一种基于长短时记忆信息的个性化对话生成方法,其特征在于,包括以下步骤:
S1将输入文本和用户对话历史的文本表示为句子向量;
S2将所述输入文本进行编码获得感知记忆信息;
S3在所述用户对话历史的文本中筛选出与所述输入文本最相似的历史作为当前输入下用户的长时记忆,将所述长时记忆进行编码得到长时记忆信息;
S4将与所述输入文本时间上最为接近的所述用户对话历史进行编码得到用户的短时记忆信息;
S5将所述感知记忆信息、长时记忆信息和短时记忆信息在每个生成时刻更新并与之前时刻的输出信息一同进行解码,从而生成具有用户个性的对话。
2.如权利要求1所述的基于长短时记忆信息的个性化对话生成方法,其特征在于,所述步骤S2中获得感知记忆信息的方法为:所述输入文本进入Seq2Seq模型进行编码得到用户对所述输入文本的感知信息,并将所述感知信息带入注意力机制,将其合并为解码过程生成回复的不同时刻的感知记忆信息。
3.如权利要求2所述的基于长短时记忆信息的个性化对话生成方法,其特征在于,所述感知记忆编码模块的公式为:
其中,表示在编码器的不同时刻i输入信息的中间隐含状态向量,n为输入的长度;xi为在时刻i输入的词;φ(·)表示获取单词词向量的函数;表示在解码j时刻模型关于输入的感知记忆信息;sj表示解码j时刻解码器的隐含状态,GRU(·)为门控循环单元函数,Attn(·)为注意力机制函数。
4.如权利要求1所述的基于长短时记忆信息的个性化对话生成方法,其特征在于,所述步骤S3中用户对话历史的文本与输入文本的相似性的判断方法为:将所述输入文本映射到与所述用户对话历史的文本相同的向量空间中,以单词的逆文档频率来衡量输入文本与用户对话历史的文本的相似性,所述单词的逆文档频率idf的计算公式为:
其中,a、b、c分别表示词表中单词的序号,文档集合中文档的序号和句子w中单词的序号;D={d1,d2,...}为整个文档集合;{b:wa∈db}为包含单词wa的文档db的集合;∈(·)表示计算句子w的句子向量的函数;φ(·)表示获取单词词向量的函数。
5.如权利要求4所述的基于长短时记忆信息的个性化对话生成方法,其特征在于,所述步骤S3中得到长时记忆信息的方法为:将所述输入文本映射到与所述用户对话历史的文本相同的向量空间中,分别计算所述输入文本与用户的历史回复以及与所述历史回复对应的其他用户的输入的句子的相似度,其计算公式为:
其中,pl和rl分别表示用户对话历史数据的其他用户输入历史和用户回复历史,L为对话历史的数目;表示输入文本X与其他用户输入历史pl的相似度;表示输入文本X与该用户回复历史rl的相似度;scl表示输入文本与第l条用户对话历史整体的相似度,通过平衡因子α来调整和的权重;
得到输入文本X与用户对话历史相似度分布sc={sc1,sc2,...,scL}后,取相似度最高的前K个对话历史,保留其时间顺序,将当前用户的回复历史Rlong={r1,r2,...,rK}作为长时记忆信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010927235.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置