[发明专利]一种基于知识感知的新闻推荐方法有效

申请号：	201911334781.7	申请日：	2019-12-23
公开（公告）号：	CN111061856B	公开（公告）日：	2022-05-27
发明（设计）人：	刘琼昕;覃明帅;宋祥;王佳升;徐建祥;卢士帅	申请（专利权）人：	北京理工大学
主分类号：	G06F16/335	分类号：	G06F16/335;G06F16/36;G06F16/9535;G06N3/04;G06N3/08
代理公司：	北京正阳理工知识产权代理事务所(普通合伙) 11639	代理人：	王民盛
地址：	100081 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于知识感知新闻推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于知识感知的新闻推荐方法，其特征在于，包括以下步骤：

首先，从新闻文本中识别出实体，将其与知识图谱中的实体相匹配，利用知识表示学习模型得到实体和关系的向量表示；其中，提取新闻文本中实体知识信息的方法为：

步骤1：使用实体链接技术，将新闻文本中的单词与知识图谱中的实体进行链接并消歧，得到新闻实体集合；

步骤2：基于新闻实体集合，从原始的知识图谱中构造出一个知识图谱子图，并从原图中抽取所有实体之间的边；将该子图扩展一跳，即，引入所有和这些实体距离为1的实体及相关的边；

步骤3：使用知识图谱特征学习方法，从扩展的知识子图中，学习实体向量和关系向量；

步骤4：为每个实体提取其额外的上下文信息，一个实体e的上下文，是指它在知识图谱中的邻居的集合，即：

context(e)＝{e′|(e,r,e′)∈G∨(e′,r,e)∈G} (1)

其中，e、e′均表示实体，r表示关系，G表示知识图谱；

将实体e的上下文向量定义为它的上下文实体的向量的平均值：

其中，e_i是实体e的上下文实体集合context(e)的第i个实体的向量表示；

然后，使用一种知识感知的深度网络DKPN建立推荐模型，具体地，用一个卷积神经网络来融合新闻的词向量和实体向量，从中学习新闻的综合特征；包括以下步骤：

步骤S1：构建新闻特征；

具体包括如下步骤：

步骤S1.1：对于一个新闻标题[w₁,w₂,...,w_n]，将每个单词w_i与其词向量w_i、实体向量e_i以及实体上下文向量一一对应，若没有相应的实体向量和实体上下文向量，则用零向量替代；同时，为解决词向量和实体向量的兼容性问题，引入映射函数g()：

g(e)＝tanh(Me+b) (3)

其中，M∈R^d×k是一个转换矩阵，b为偏置常量，该函数将k维的实体向量和实体上下文向量映射到d维的向量空间中，与词向量一致；将词向量、映射后实体向量和映射后的实体上下文向量堆叠后，得到三通道输入W：

其中，R^d×n×3表示d×n×3的实张量空间，R为实数空间；

步骤S1.2：用一个知识感知的卷积神经网络，从W中提取新闻特征：

首先，通过卷积核h∈R^d×l×3提取卷积特征，进行卷积操作后得到相应特征

其中，*为卷积操作，b为偏置常量，f为非线性映射函数，W_i:i+l-1表示卷积核h的窗口所覆盖的部分输入；卷积核h对整个W进行卷积操作后可得一组特征

然后，对c^h进行最大池化操作，从c^h的分量中选取最大值作为高层特征：

对于包含m个卷积核的卷积神经网络，新闻标题t的最终特征为：

步骤S2：构建实体路径特征；

对于知识图谱中的一条包含L个实体的路径其中e_l是路径中的第l个实体，关系r_l在路径中连接实体e_l和实体e_l+1，实体e_l和关系r_l对应的向量分别记为e_l∈R^k和r_l∈R^k；利用长短期记忆网络LSTM提取知识图谱中指定的两个实体之间的路径特征，LSTM接受一个向量序列作为输入；对于路径中的每个实体e_l，按照下式构造LSTM的第l个输入x_l：

其中，为连接运算符，将实体向量e_l和关系向量r_l连接为一个2d维的向量x_l；对于最后一个实体向量e_L，用一个零向量与其相连接；LSTM中间层各项变量计算如下：

其中，c_l∈R^d′和z_l∈R^d′分别为细胞状态以及当前细胞要更新的信息，i_l、o_l和f_l分别为输入门、输出门和遗忘门；W_z∈R^d'×2d、W_f∈R^d'×2d、W_i∈R^d'×2d、W_o∈R^d'×2d和W_h∈R^d′×d′为映射矩阵，d′为隐含层的单元数量，即状态向量的维度；b_z、b_f、b_i和b_o为偏置向量；σ为Sigmoid函数，⊙为逐元素的乘法运算；

用表示LSTM网络，LSTM的最后一层输出h_L作为整个路径的特征向量表示，即

步骤S3：构建用户兴趣特征；

设用户u的新闻标题点击记录为相应的新闻特征向量为其中，N_u为用户u的点击总数；用一个注意力网络，根据用户点击历史和不同的候选新闻，动态构建用户特征；给定一个候选新闻t_j，为了衡量用户u点击过的新闻对t_j的影响度，考虑两方面因素，一方面是和t_j的特征向量和另一方面是中的实体和t_j中的实体之间的路径特征；给定和t_j之间的条实体路径路径特征记为

将新闻特征候选新闻特征以及路径特征拼接后，输入到一个全连接注意力网络中，输出对t_j的影响权重，对权重进行归一化后得到影响因子

在预测用户u是否会点击新闻t_j时，用户u的兴趣特征q_u计算如下：

则总的路径特征为：

步骤S4：构建预测用户点击概率

基于用户兴趣特征q_u、候选新闻特征和路径特征使用一个全连接网络来预测用户u点击新闻t_j的概率：

即为模型预测函数；

步骤S5：根据训练集数据和损失函数，对模型参数进行训练更新；

其中，损失函数定义如下：

其中，(u,t)是用户-候选新闻对，是正样本集，是负样本集；

训练数据处理完毕后，输入测试集数据，用来测试模型效果；若效果指标不再提高或达到要求，停止迭代，保存结果；

对于每一个候选新闻，基于用户的浏览历史与候选新闻之间的相关性，使用一个注意力网络动态地构建用户特征；同时，考虑已点击的新闻中的实体与候选新闻中的实体之间的路径，利用长短期记忆网络来从路径中生成路径特征；

最后，以候选新闻特征、用户特征和路径特征为输入，用一个多层感知机来计算用户点击候选新闻的概率，据此向用户进行新闻推荐。