[发明专利]一种基于用户评论情感分析与矩阵分解的推荐方法有效
申请号: | 202011515118.X | 申请日: | 2020-12-21 |
公开(公告)号: | CN112632377B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 高岭;牛秀娟;王文涛;吴旭东;孙俊辉 | 申请(专利权)人: | 西北大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06N3/0442;G06N3/0464;G06N3/049;G06N3/08 |
代理公司: | 西安西达专利代理有限责任公司 61202 | 代理人: | 刘华 |
地址: | 710069 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户 评论 情感 分析 矩阵 分解 推荐 方法 | ||
1.一种基于用户评论情感分析与矩阵分解的推荐方法,其特征在于,包括以下步骤:
步骤1,获取用户的评论信息和评分信息,构建用户评分矩阵;
步骤2,对评论信息进行文本预处理,减少原始文本数据集中的无效字符以降低其对实验结果的影响,同时使算法能有效的抓取文本数据集中具有明显情感特征的词以提升算法对于文本的情感极性分析的准确度,因此构建能有效表示文本情感极性特征的句向量,采用消除无效字符、数字字符、替换文本缩写、大写字符转小写字符、修改文本拼写错误预处理方法对原始文本数据集进行预处理,对预处理后的文本根据其词频进行向量化编码,包括:
设定在语料库中的每个单词w都有唯一的整数数值v相互映射,其中v∈N,v的值越大则表示该单词在语料库中存在的数量越少,随后对句子中的每一个单词及其所在的位置选择语料库中该单词映射的数值,最后评论文本中所有的单词集合{w1,w2,...,wi}所对应的数值所构成的向量{v1,v2,...,vi}作为文本句向量,其中i表示为文本中词的位置;
步骤3,基于TF-IDF的文本词向量方法更新文本句向量以寻找句向量中情感特征词,得到英文评论文本句向量表示,包括:
假设文本中的目标单词w在语料库中的单词向量值为v,则可以得到基于TF-IDF方法更新后的单词向量值w2v;
其中,TF-IDF[w]代表单词w在语料库中的TF-IDF值,vector表示根据词频得到的文本句向量,而Lenth代表在文本设定的句向量中固定句向量长度,w2v为目标单词更新后的文本句向量;
步骤4,将得到的文本句向量及其对应的情感倾向标签信息输入到基于LSTM的循环神经网络中进行训练以构建文本情感倾向分析模型来预测评论情感倾向,包括:
1)将得到的文本句向量分为训练集和测试集,将得到的训练集中的句向量及其对应的情感倾向标签输入到基于LSTM的循环神经网络中进行训练,设定损失函数、优化方法使用,同时设定最大迭代次数T,Batch_size参数值及Dropout层激活概率参数后进行网络训练;
2)直到基于LSTM的循环神经网络迭代到最大迭代次数T时停止迭代,得到基于句向量的文本情感倾向分析网络,随后将测试集用于网络进行实验验证,输出网络对于测试集的预测准确度P;
3)选取目标评论文本计算得到文本句向量,将文本句向量输入到训练完成的网络中进行情感倾向分析,输出目标文本的情感倾向;
步骤5,判定文本情感分析方法得到的情感值是否为误差偏离值,判定文本情感分析方法得到的情感值是否为误差偏离值,包括:
假设用户评论文本情感值的范围为[0,1],且用户给予商品评分的范围为[0,1],若用户的评论的情感值为S,用户评分的值为R,当且仅当用户评论情感值S与用户评分值R的相差范围小于等于0.2时评论情感值不为误差偏离值,否则评论情感值为误差偏离值,若为误差偏离值则表示该文本情感分析算法得到的文本情感值不符合用户实际评分,当且仅当文本情感值不为误差偏离值时将该情感值引入用户评分矩阵中进行后续计算;
步骤6,将用户文本评论情感值引入到用户历史评分并计算用户评分标准值,包括:
若用户的评论情感值为S,用户评分的值为R,设定评论情感值与评分值的混合参数为δ,当且仅当评论情感值S不为偏离值时进行评论情感值与评分值混合得到用户评分标准值SR;
其中,δ为用户评论情感值与用户评分情感值混合参数,SR表示用户评论情感值与历史评分值混合之后的用户评分标准值,若参数δ值越大则说明用户的评分标准值更趋向于评论情感值,而若参数δ值越小则说明用户评分标准值更趋向于用户实际评分值;
步骤7,利用矩阵分解方法对用户评分标准值进行评分预测,包括:
基于矩阵分解模型的思想假设存在m个用户和n个项目,对于给定的用户评分标准值矩阵,其中每一个物品i都与一个K维向量qi相关联,每一个用户都与一个K维向量pu相关联,用户评分标准值预测的计算公式如下:
其中,μ为用户的基准预测,bu为用户偏置项,bi为项目偏置项,为学习模型参数且使预测评分值能接近于实际评分值,则通过采用随机梯度下降算法最小化正则化的平方误差;
min∑(rui-μ-bi-bu-qiTpu)2+λ(bi2+bu2+||qi||2+||pu||2)。
2.根据权利要求1所述的一种基于用户评论情感分析与矩阵分解的推荐方法,其特征在于,所述的步骤1中获取用户的评论信息和评分信息,包括:用户对项目的所有评论与评分信息,获取数据的方式为利用网络爬虫。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011515118.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:三维存储器件及其形成方法
- 下一篇:一种安全管理系统