[发明专利]一种基于分维度情感分析的电影推荐方法有效
申请号: | 201910387095.X | 申请日: | 2019-05-10 |
公开(公告)号: | CN110096618B | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 彭扬;王倩倩;张睿 | 申请(专利权)人: | 北京友普信息技术有限公司 |
主分类号: | G06F16/78 | 分类号: | G06F16/78;G06F16/9535;G06F40/289;G06K9/62 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国栋 |
地址: | 100088 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 维度 情感 分析 电影 推荐 方法 | ||
本发明公开了一种基于分维度情感分析的电影推荐方法,通过爬取电影的评论数据、对评论数据进行数据预处理、对进行数据预处理后的评论数据进行特征维度的提取、将提取到的特征维度进行合并处理、将合并处理后的特征维度排序、构建适用于电影领域的情感词典、利用构建的情感词典对电影的评论数据进行情感分析,获取电影的类型模型、对电影的类型模型进行聚类运算得出推荐结果等步骤。优点是:通过对用户电影评论进行分特征维度的情感分析,计算出电影的类型模型,更精确更全面地展现了电影的各特征维度特点,从而提升了推荐服务的质量水平,在一定程度上改善了传统的不分特征维度的推荐算法准确率偏低的问题。
技术领域
本发明涉及电影推荐领域,尤其涉及一种基于分维度情感分析的电影推荐方法。
背景技术
随着互联网的迅猛发展,不同种类的软件、网站层出不穷,在其丰富我们生活的同时,想要从茫茫数据中找寻到自己感兴趣适合的内容也变得更加困难,因此推荐系统应运而生。以往的推荐系统往往利用评分或者评论的整体情感进行推荐,缺乏对评论的深度挖掘,评论中可能涵盖了“演员”、“导演”、“风格”等多个维度的信息,用户对不同维度的情感倾向是不同的,若只根据总体情感进行推荐,准确率较低。以往的电影推荐主要利用的是用户打出的评分或是电影评论的整体情感倾向来做出推荐。某些制片方为了利益可能会招募一些人给他们的产品打高分,导致推荐的结果并不可信。现有的情感分析大致分为两类,基于词典的方法和基于机器学习的方法,已有的情感分析算法各有优缺点,导致单一的情感分析方法无法适用于电影推荐系统中,降低了系统的性能。
发明内容
本发明的目的在于提供一种基于分维度情感分析的电影推荐方法,从而解决现有技术中存在的前述问题。
为了实现上述目的,本发明采用的技术方案如下:
一种基于分维度情感分析的电影推荐方法,包括如下步骤,
S1、通过爬虫爬取电影的评论数据;
S2、对爬取得到的评论数据进行数据预处理;
S3、对进行数据预处理后的评论数据进行特征维度的提取;
S4、将提取到的特征维度利用Hownet语义相似度进行合并处理;
S5、将合并处理后的特征维度按照重要性进行排序;
S6、在已有权威性情感词典中加入适用于电影的情感词,构建适用于电影领域的情感词典;
S7、利用构建的情感词典对电影的评论数据进行情感分析,得出每部电影的每条评论中各个特征维度的情感值,获取电影的类型模型;
S8、利用二分聚类对电影的类型模型进行聚类运算得出推荐结果。
优选的,步骤S2中,所述数据预处理具体包括分词、去停用词以及词性标注。
优选的,步骤S5中,所述重要性通过简化PageRank来评判。
本发明的有益效果是:1、通过对用户电影评论进行分特征维度的情感分析,计算出电影的类型模型,更精确更全面地展现了电影的各特征维度特点,从而提升了推荐服务的质量水平,在一定程度上改善了传统的不分特征维度的推荐算法准确率偏低的问题。2、数据预处理步骤可以去掉一些无效的、重复的数据,且将数据处理成方便后续计算处理的形式。提取合并以及排序电影特征维度可以从电影评论中挖取细粒度的特征维度,可以体现更为具体的电影特征。3、特征维度进行重要性排序,这样可以降低算法的复杂度。构建针对性的情感词典能够提高情感分析的准确度。4、通过二分聚类能够克服普通K-means聚类算法容易收敛于局部最小值问题。
附图说明
图1是本发明实施例中电影推荐方法的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京友普信息技术有限公司,未经北京友普信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910387095.X/2.html,转载请声明来源钻瓜专利网。