[发明专利]一种基于用户对话历史的个性化对话生成方法和系统在审
申请号: | 202011060186.1 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112182161A | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 窦志成;文继荣 | 申请(专利权)人: | 中国人民大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/30;G06K9/62 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 赵悦 |
地址: | 100872 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 对话 历史 个性化 生成 方法 系统 | ||
1.一种基于用户对话历史的个性化对话生成方法,其特征在于,包括以下步骤:
S1将用户对话历史的文本表示为句子向量;
S2通过对所述句子向量进行编码得到用户个性向量,所述用户个性向量中包含了所述句子向量的时序信息;
S3根据所述用户个性向量和所述句子向量的时序信息生成个性化对话模型;
S4将新的输入文本的词向量输入所述个性化对话模型生成个性化对话的回复。
2.如权利要求1所述的基于用户对话历史的个性化对话生成方法,其特征在于,所述步骤S4中输入的词向量进入编码器进行编码,并将经过编码的所述输入的词向量带入注意力机制,经过注意力机制后,进入所述个性化对话模型进行解码。
3.如权利要求2所述的基于用户对话历史的个性化对话生成方法,其特征在于,所述个性化对话模型的解码公式为:
st=GRUdecoder(st-1,[φ(yt-1),ct,Vu])
其中,GRU是门控循环单元,st是解码器在解码过程中每个时刻t的隐含状态;φ(·)表示获取词向量的函数;yt是在时刻t生成词的词向量ci是通过注意力机制权重对编码器所有中间状态加权求和得到的上下文信息的向量;Vu是用户u的个性向量。
4.如权利要求3所述的基于用户对话历史的个性化对话生成方法,其特征在于,获取所述步骤S2中的个性向量的方法为:首先通过计算用户对话历史中单词的逆文档频率对单词词向量付以不同权重,随后通过GRU提取用户对话历史中的时序信息,并使用最后一个时刻得到的隐含状态,作为用户全局的个性化角色信息。
5.如权利要求4所述的基于用户对话历史的个性化对话生成方法,其特征在于,所述单词的逆文档频率idf的计算公式为:
其中,a、b、c分别表示词表中单词的序号,文档集合中文档的序号和句子w中单词的序号;D={d1,d2,…}为整个文档集合;{b:wa∈db}为包含单词wa的文档db的集合;∈(·)表示计算句子w的句子向量的函数;φ(·)表示获取单词词向量的函数。
6.如权利要求4所述的基于用户对话历史的个性化对话生成方法,其特征在于,所述用户全局的个性化角色信息的计算公式为:
其中,R={r1,r2,..,rL}表示用户的回复历史,rl为用户对话回复历史第l条回复文本,L为用户回复历史长度;为在用户第l条回复后其角色向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011060186.1/1.html,转载请声明来源钻瓜专利网。