[发明专利]一种基于用户偏好图的多子目标对话推荐方法有效
申请号: | 202210437356.6 | 申请日: | 2022-04-21 |
公开(公告)号: | CN114912020B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 杨静;凌静 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9032 |
代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 偏好 目标 对话 推荐 方法 | ||
1.一种基于用户偏好图的多子目标对话推荐方法,其特征在于采用构建的用户偏好图Kp,利用关键实体预测模块预测下一轮对话内容的关键实体,并由对话生成模块生成每一轮系统对历史对话的回复,具体包括如下步骤:
a步骤:建立用户偏好图构建模块
a-1:在对话开始前,基于用户配置文件初始化用户偏好图Kp;
a-2:在对话进行时,根据实体文件匹配对话中提及的实体集合E,并通过基于预训练的语言模型预测用户的实体级偏好;
a-3:根据用户实体级偏好更新用户偏好图Kp;
b步骤:建立关键实体模块
基于当前用户偏好图Kp和子目标,确定候选关键实体并通过语言模型预测关键实体;
c步骤:建立对话生成模块
基于历史对话、用户偏好图Kp及关键实体相关信息通过深度神经网络模型生成回复来与用户进行交互,交互内容包括闲聊、问答或推荐;
所述a步骤中的初始化用户偏好图Kp具体包括以下步骤:
a-1-1:取多子目标对话数据的用户配置文件中用户接受的实体和知识图谱中存在实体的交集作为用户偏好图Kp的初始核心结点;
a-1-2:将知识图谱中用户偏好图Kp的初始核心结点及其一跳范围内的点和边构成的子图作为最初的用户偏好图Kp,并为每个初始核心结点赋权重为1;
所述b步骤中的确定候选关键实体并通过语言模型预测关键实体,具体包括以下步骤:
b-1:通过基于Transformer的方法预测下一个子目标gnext,在给定对话历史X、外部知识K和推荐子目标GT的条件下,预测下一回合的子目标gnext,并由下述(h)式优化交叉熵损失函数-logP:
其中,为当前已经生成的子目标字符;
b-2:基于由子目标确定的推荐类型,找出所有知识库中该类型的实体作为候选关键实体集合Ec,所述推荐类型包括:电影、音乐、美食和兴趣点;
b-3:基于用户偏好图Kp和由所述知识图谱中与候选关键实体ec∈Ec相关的三元组构成的子图Kc,通过预训练的语言模型给每个候选关键实体ec打分,取分数最高的候选实体作为关键实体ekey,其过程由下述(i)~(l)式表示:
Fp=[s1;r1;o1;…;sn;rn;on],(si,ri,oi)∈Kp (i);
Fc=[s1;r1;o1;…;sm;rm;om],(sj;rj;oj)∈Kc (j);
H=BERT([[CLS];gnext;Fp;[SEP];Fc]) (k);
S(ec)=Sigmoid(Wh0) (l);
其中:h0为[CLS]的表示;W是可训练的参数;
所述c步骤中的通过深度神经网络模型生成回复具体包括以下步骤:
c-1:将b步骤中的子目标gnext进一步分为推荐子目标和非推荐子目标,所述推荐子目标包括:电影推荐、音乐推荐、美食推荐和兴趣点推荐,除推荐子目标外的子目标都为非推荐子目标;
c-2:在非推荐子目标下,将用户偏好图Kp中所有的知识三元组作为参考知识Kinput输入对话生成模型;在推荐子目标下,将知识库中与b步骤中的关键实体ekey相关的三元组构成的子图Kkey作为参考知识Kinput输入对话生成模型;所述对话生成模块包括:编码器和解码器;所述对话生成模块生成回复的具体过程如下述(m)~(o)式表示:
F=[s1;r1;o1;…;sn;rn;on],(si,ri,oi)∈Kinput (m);
EK=Encoder(F) (n);
其中,EK为参考知识Kinput中的三元组拼接后通过编码器得到的知识特征;I(·)表示获取嵌入的函数;yt是已经解码得到的词;是t时刻解码器输出的隐藏状态;
c-3:基于知识特征EK和历史对话X和已解码部分的表示,得到第t步的输出特征;
c-4:利用设置在解码器上的复制机制,将知识信息整合到回复中,其单词概率P(w)通过下述(p)~(s)式所表示的复制机制计算:
其中,Wv为嵌入矩阵;Wk为可训练的参数;Ps决定模型从词汇表还是从参考知识Kinput生成一个字;
c-5:通过下述(t)式的优化交叉熵损耗训练对话生成模块:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210437356.6/1.html,转载请声明来源钻瓜专利网。