[发明专利]一种基于电影结构化信息和简介预测电影评分类别的方法有效

专利信息
申请号: 201911347391.3 申请日: 2019-12-24
公开(公告)号: CN111104552B 公开(公告)日: 2023-06-06
发明(设计)人: 詹珂;杜歆 申请(专利权)人: 浙江大学
主分类号: G06F16/75 分类号: G06F16/75;G06F40/289;G06F40/295;G06N3/02
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 电影 结构 信息 简介 预测 影评 分类 别的 方法
【说明书】:

发明公开了一种基于电影结构化信息和简介预测电影评分类别的方法。该方法首先对电影的结构化信息和电影的简介进行清洗和预处理,构建电影结构化信息的“电影实体‑关系‑信息实体”三元组以及电影简介的文本数据集。利用电影结构化信息生成的三元组训练电影实体向量,利用电影简介的文本数据训练出文档向量。将电影实体向量和文档向量拼接组成的电影特征向量输入电影对应的评分训练分类模型,预测电影评分的类别。本发明通过结合电影自身信息构建分类模型,没有涉及用户相关的评价和情感偏好,提升了预测电影评分分类的准确率,可以有效解决进行新片评分预测的“冷启动”问题。

技术领域

本发明涉及一种基于电影结构化信息和简介预测电影评分类别的方法。具体来说,就是给定了电影的结构化信息(如电影导演,演员,类别等)和电影简介,通过生成电影实体向量和文档向量从而预测电影评分类别的方法。

背景技术

电影评分是用户在观看电影之后对于电影总体评价的一个量化。一方面,电影评分是衡量一部电影质量的重要标准。越来越多的人在观影前,都会选择电影评分作为观看与否的一个标准。另一方面,电影发行商在追求电影票房带来的收益的同时,也越来越注重电影的口碑。仅仅依靠电影的宣传噱头获得的前期票房收益很难持久,随着信息传递速率的飞速增长,在如今电影市场下,市场的反馈决定了最终的电影票房,而电影评分就是一种直观的市场反馈。电影评分的预测一般依赖电影本身的特征和评价用户群体的特性,是电影在市场预期评价的一种度量,能够在观影前给予用户较准确的心理预期,也能够帮助资方在投资电影和市场宣传方面提供较准确的市场前瞻反馈。

目前电影评分预测主流都是依靠用户-电影交互信息以及电影本身特性,采用协同过滤等方法挖掘出用户深层偏好以及用户类群的共同偏好。一般挖掘用户对于电影的显式评价如评分、评论和隐式评价如点击、观看记录中蕴含的用户-电影关系。在工程应用情况,获得大量用户对于电影的反馈数据比较困难,同时还存在新电影的冷启动问题。实际上,电影发行之际就存在电影的结构化信息(导演、演员、类型、语言等)和电影的简介,信息获取难度较小。同时电影的某些结构化信息对于电影评分有着重要的影响,比如“xxx演员是电影品质的保证”,“xxx导演专门导烂片”,“国产惊悚片普遍评价不高”。而电影从某种意义来说就是讲述一个故事,电影的简介就是电影的故事性的一个“缩影”,因此电影简介对于“故事”的讲述好坏也存在一定反映。

发明内容

本发明是针对现有方法的不足,提出了一种基于电影结构化信息和简介预测电影评分类别的方法。该方法依靠电影的结构化信息和简介生成电影实体向量和文档向量,再依靠神经网络挖掘向量特征之间的深层关系从而做到较好的评分分类预测。

本发明的目的是通过以下技术方案来实现的:一种基于电影结构化信息和简介预测电影评分类别的方法,该方法包含以下步骤:

(1)对电影的结构化信息和简介进行清洗和预处理。具体包括以下子步骤:

(1.1)删除电影简介过少、电影简介异常或者缺失电影简介的电影样本;

(1.2)删除电影简介中的特殊符号等非文本信息;

(1.3)将结构化信息中演员、导演等人名加入词库,对电影简介进行分词处理,并删除停用词;

(1.4)删除缺失类型、语言、导演、演员、编剧等结构化信息的电影样本,得到清洗过的结构化信息;

(1.5)将清洗过的结构化信息生成“电影实体-关系-信息实体”的三元组,所述电影实体为电影名称,信息实体包括电影的类型、语言、导演、演员、编剧等。

(2)使用电影结构化信息生成的三元组训练生成电影实体向量。具体包括以下子步骤:

(2.1)每个电影实体分配唯一的电影实体向量f,每个关系分配唯一的关系向量r,每个信息实体分配唯一的信息实体向量i;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911347391.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top