[发明专利]一种基于海报与剧情介绍的电影类型的快速分类方法在审
申请号: | 201510592018.X | 申请日: | 2015-09-17 |
公开(公告)号: | CN105260398A | 公开(公告)日: | 2016-01-20 |
发明(设计)人: | 胡卫明;付志康;李兵 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/46;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 海报 剧情 介绍 电影 类型 快速 分类 方法 | ||
技术领域
本发明涉及模式识别领域,特别涉及电影类型的检测技术。
背景技术
随着互联网的快速发展,电影已经成为人们业余生活中不可缺少的一部分。目前为止、还没有对电影的种类做出统一的规定,电影的类别大体分为:恐怖、爱情、动作、喜剧、科幻等等。电影网站上都会人工给电影标上类别标签,所以、实现电影的快速分类是很有必要。
电影类型的检测基本上都是基于视频内容本身来检测。视频内容的检测包括:镜头边界的检测、镜头视频关键帧的检测和音频特征的检测。镜头边界检测的基本假设是相邻两个镜头的内容存在较大的差异。因此,可以通过测量相邻帧之间的差异程度来确定镜头的边界。镜头视频关键帧的特征包括:视频关键帧的颜色、对比度、明亮度、纹理等特征。通过提取这些特征对视频的关键帧进行检测。音频特征主要有:时域特征、频域特征和声学感知特征等。
基于视频内容的检测存在以下问题:需要的数据量大、视频检测较慢、在没有视频内容本身的情况下显然无法完成检测任务,同时准确率不是很高。
发明内容
(一)要解决的技术问题
本发明的目的在于提出一种在没有电影视频的情况下可以方便快速地对电影进行检测的方法,从而实现了快速的电影分类。
二)技术方案
为了解决上述技术问题,本发明提出了一种基于海报与剧情介绍的电影类型的快速分类方法,该方法包括以下步骤:步骤1:确定电影所属的类型集合,建立各种类型的电影的海报训练集和剧情介绍的训练集;
步骤2:提取待测电影的海报的特征,利用得到的每幅海报的特征及其对应的标签训练支持向量机得到海报的分类模型;
步骤3:提取待测电影的剧情介绍的文本的特征,利用得到的每个文本的特征及其对应的标签训练支持向量机得到文本的分类模型;
步骤4:用海报的分类模型,对待测电影的海报进行预测得到类型Y1,然后再调用文本的分类模型对待测电影的剧情介绍进行预测得到类型Y2;最后将Y1和Y2进行“或”操作;即与待测电影的类型标签对比,只要一个预测结果是正确的,则预测正确的那个类型当作最后的待测电影的类型;否则将Y1作为最后的待测电影的类型。
(三)有益效果
本发明结合电影的海报和剧情介绍对电影的类型进行检测,能够在没有电影视频的情况下,对电影的类型实现快速、高准确率的检测。
附图说明
图1是本发明的基于海报与剧情介绍的电影类型的快速分类方法的流程图。
图2是本发明的确定电影的类型,和获得类型集合的方法流程图。
图3是本发明的获得海报分类模型的方法流程图。
图4是本发明的获得文本分类模型的方法流程图。
图5是本发明的获得待测电影类型的方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
本发明的方法具体运行的硬件和编程语言并不受限制,用任何语言编写都可以实现本发明的方法。本发明采用一台具有2.67G赫兹中央处理器和4G字节内存的计算机,并用C++语言编制本发明所涉及到的程序,实现了本发明的方法。
图1是基于海报与剧情介绍的电影类型的快速分类方法的流程图。
步骤101:搜集中外视频网站,确定电影所属的类型集合,搜集尽可能多的电影对应的海报和剧情介绍,建立电影海报的训练集和剧情介绍的训练集,具体流程如图2所示。
首先搜集中外视频网站上的电影常见类型,确定常见的电影类型集合为:恐怖片、爱情片、喜剧片和动作片等。然后搜集尽可能多的这四种类型的电影的海报和剧情介绍。分别建立电影海报的训练集和电影剧情介绍的训练集。
步骤102:提取海报的特征,利用得到的每幅海报的特征及其对应的标签训练支持向量机得到海报的分类模型,具体流程如图3所示。
1):提取海报的特征。
对每幅海报提取的海报的特征包括:颜色情感特征、颜色和谐度特征、边缘特征、纹理特征、颜色变化特征和海报中人脸的个数。
颜色情感特征的计算方法如下。颜色情感常用来描述图像的情感。在颜色情感特征的计算中,首先,将RGB颜色空间转换到CLELAB和CLELCH颜色空间中,与颜色情感特征有关的三个因素为:热度(heat)、重要性(weight)和活动性(activity),该三个因素的计算方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510592018.X/2.html,转载请声明来源钻瓜专利网。