[发明专利]面向细粒度情感的可解释推荐模型有效
申请号: | 201910333302.3 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110083684B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 王英;孙玉东;王鑫;李畅;于尤婧;孙小婉;凌云志;马涪元 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F16/36;G06Q30/02 |
代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 李荣武 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 细粒度 情感 可解释 推荐 模型 | ||
1.一种面向细粒度情感的可解释推荐模型,其特征在于:
(1)由互信息矩阵构建模块实现多信息的高效融合:
1)针对某一特定推荐环境,对任何由用户为实体打分同时产生评论文本的数据进行抽取、过滤等预处理;
2)对评论文本进行解析,抽取用户对实体的细粒度情感信息,构建(k,w,s)ij三元组;
其中:(k,w,s)ij表示用户i对实体j的细粒度情感的三元组,k表示实体j的特定方面,w表示用户i针对该特定方面的描述性词语,s表示该描述性词语的情感极性标签;
3)构建用户-实体评分矩阵R;
①根据数据集D中的评分构建稀疏的用户-实体评分矩阵
其中:m表示用户数量,n表示实体数量,Rij=rij表示第i个用户对第j个实体的评分值,不存在评分时Rij=0;
4)筛选具有实际意义的实体-属性对;
①对于用户在对实体的评论文本中出现的属性,定义为该实体拥有的实际属性,对于其他在该实体中未曾被用户提及的属性不参与矩阵的构建和计算;
5)构建用户-实体属性情感矩阵S;
①利用从用户i的全部评论抽取的多个三元组(k,w,s)ij,定义sijkw;其中:sijkw表示用户i对实体j的属性k所使用的描述词w的情感,根据描述词的情感极性其值为+1或-1;
②由1)中的定义计算用户i对实体j的属性k的总体情感Q表示从数据集中提取的全部的描述词数量,重复的描述词仅计数一次;
③最终构建用户-实体属性情感矩阵S如下:
其中:N为常量,取值一般为评分区间的最大值;对每一个经上述公式进行平滑处理后即得到用户-实体属性情感矩阵S,后续计算中以Si(jk)表示用户i存在对实体j-属性k的情感值,S中的每一列表示筛选后的实体-属性,共p'列,且由(1)-4)中筛选的具有实际意义的实体-属性数量通常远小于全部实体和全部属性的两两组合数量,即在大部分数据集中p'<<n*p,p表示数据集中出现的所有属性的数量;
6)构建实体属性-描述词词频矩阵O;
①利用从实体j的全部评论抽取的多个三元组(k,w,s)ij,得到实体j的属性k被描述词w描述的次数为nw;
②定义描述实体属性的描述词词频矩阵如下:
其中:(j,k,w,nw)表示评论数据dij中实体j的属性k被描述词w描述的次数为nw,Set为(j,k,w,nw)构成的集合,β、δ均为经验参数,exp()表示自然数为底数的幂次运算;
(2)由联合分解模块初始化因子矩阵进行多矩阵的约束优化求解:
1)初始化用户、实体、属性、描述词隐式因子矩阵;
①构建用户隐式特征矩阵其中m为用户数量,a为用户隐式特征向量维度;
②构建实体的隐式特征矩阵其中n为实体数量,b为用户隐式特征向量维度;
③构建属性的隐式特征矩阵其中p为不重复属性数量,c为用户隐式特征向量维度;
④构建描述词的隐式特征矩阵其中q为不重复描述词数量,d为用户隐式特征向量维度;
2)构建共享因子矩阵A,A',分别用以分解R,S和S,O;
①定义实体与评分相关的潜在固有属性所对应的隐式特征向量f*,其特征维度为c,所有实体中均有该属性不同于实体的独特属性;
②构建隐式因子矩阵A由隐式特征矩阵I和f*两部分构成,A中每一行为I的每一行和向量f*的增广拼接得到A∈Rn*(b+c);
③构建隐式因子矩阵A'由产品隐式特征矩阵I和属性隐式特征矩阵F两部分组成,A′(jk)表示A'中一行,为产品特征向量Ij与属性特征向量Fk的增广拼接;
3)计算用户、实体、属性、描述词隐式因子矩阵;
①通过最小化评分矩阵R中真实评分与隐式特征矩阵相乘重构评分的平方差得到最优参数U,I,f*,公式如下:
其中各符号如上述;
②通过最小化用户-实体属性情感矩阵S中由数据得到的情感值与隐式特征矩阵相乘重构情感值的平方差得到最优参数U,I,F,公式如下:
其中各符号如上述;
③通过最小化实体属性-描述词词频矩阵O中由数据得到的真实词频与隐式特征矩阵相乘重构情感值的平方差得到最优参数I,F,W,公式如下:
其中各符号如上述;
④以上1)2)3)步骤同时进行计算,使用共同的隐式特征矩阵进行优化计算,采用自适应的小批量梯度下降方法优化以上公式,能够在一定程度上避免陷入局部最优,自适应方法能够随迭代次数动态更新步长;
(3)由推荐及预测模块实现信息的高效重构进而生成最终的推荐结果以及解释信息:
1)计算用户对目标实体的预测评分;
①Rij表示目标用户i对实体j的预测评分,通过用户隐式特征向量Ui以及隐式因子Aj相乘得到该预测评分即Rij=Ui*Aj;
2)计算用户对目标实体属性的预测情感值;
①Si(j,k)表示目标用户i对实体j的属性k的预测情感值,通过用户隐式特征向量Ui以及共享隐式因子A′(j,k)相乘得到该预测情感值,即Si(j,k)=Ui*A′(j,k)
3)计算目标实体被目标描述词描述的预测频率;
①Ow(j,k)表示目标实体j的属性k被目标描述词w描述的预测频率,通过描述词隐式特征向量Ww以及共享隐式因子A′(j,k)相乘得到该预测情感值,即Ow(j,k)=Ww*A′(j,k)
4)依据1)所得到的预测评分给出对目标用户的推荐结果,依据2)3)预测用户实体属性的情感以及实体被描述词描述的预测频率给出该推荐结果的解释。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910333302.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于随机游走的实体语义标注方法
- 下一篇:用于意图识别的数据配置方法及装置