[发明专利]一种基于微博分析电视节目收视情况的方法有效
申请号: | 201310328471.0 | 申请日: | 2013-07-31 |
公开(公告)号: | CN103425755A | 公开(公告)日: | 2013-12-04 |
发明(设计)人: | 王永恒;杜凯;王乐;袁志坚;付伟;陈颖文 | 申请(专利权)人: | 王永恒 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 深圳市兴科达知识产权代理有限公司 44260 | 代理人: | 王翀 |
地址: | 410008 湖南省长沙*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分析 电视节目 收视 情况 方法 | ||
技术领域
本发明涉及计算机应用技术领域,尤其是涉及一种基于微博分析电视节目收视情况的方法。
背景技术
电视作为一种经典传媒,对社会及人们的生活有重大的影响。当前,我国电视产业蓬勃发展,电视台尤其是卫视之间竞争激烈。各卫视纷纷推出自己的王牌节目来吸引观众,如湖南卫视的“我是歌手”、江苏卫视的“非诚勿扰”、浙江卫视的“中国好声音”等。对电视节目的收视情况、观众意见进行全面的分析,对于电视台的发展战略、节目制作、观众互动等,有着重要的价值。
随着互联网、智能手机、移动设备的普及,电视行业进入了一个新的时代—社交电视时代。除了使用传统的电视机,越来越多的观众使用电脑、手机、平板电脑等新型手段来收看电视节目。例如湖南卫视的“快乐大本营”,每期网上点播的次数平均达到5千万次。同时,电视观众喜欢在观看电视节目时或观看节目后,通过微博、社交网络等手段来分享自己的感受。根据英国ThinkBox公司的最新调查,有60%的观众在看电视的同时上网,44%的人看电视时使用社交网络,19%的人在社交网络中分享电视内容。在伦敦奥运会期间,腾讯奥运视频日均播放量超2亿,新浪微博上奥运话题讨论量突破3.9亿次。社交电视的新特征使电视节目的收视评价面临新的挑战,同时也提供了新的机遇让电视台去更深入地了解他们的观众。
尼尔森收视率调查是评价电视节目收视率的经典方法,通过特定的设备连接到电视,或者问卷调查的方式来统计收视率。这种方法的缺陷是调查样本小,结果容易受调查人群特征的影响。同时,在社交电视的新时代,尼尔森方法无法覆盖新型的收视手段,从而难以获得合理的结果。例如“绝命毒师”(Breaking Bad)和“广告狂人”(Mad Men)等剧,尼尔森调查的收视率很低,但从微博等其它媒体看,这些电视剧的收视情况很好。同时,尼尔森收视调查只能调查收视率,而无法对观众的特征、评价、感受等做进一步了解。
目前,对电视节目全面分析的相关工作主要基于Twitter,获取电视节目相关的微博主要依赖于关键词搜索。在进行微博分析时主要采用的是传统的英文分类、聚类等方法;基于关键词搜索的方法容易遗漏大量的相关微博,而抓取到的微博又常常有很多是和节目无关的,缺乏针对电视节目进行微博分析的系统化方法。同时,英文微博分析使用的WordNet,SentiWordNet等词典,无法在中文微博分析中使用。
专利201280000300.9公开了一种调查收视率的方法,接收正在播放的电视节目录音指令;对所述电视节目录音;向所述服务器发送录音的电视节目音频流,使服务器根据所述录音的电视节目音频流统计出所述电视节目的收视率。此方法虽能提高收视率的准确性,但此方法存在两点缺陷:(1)对于电脑、手机等收视手段,无法获取录音;(2)只能获取收视率,无法获取不同节目的用户特征、用户对节目的评价等信息。
发明内容
本发明所要解决的技术问题是,克服现有技术存在的上述缺陷,提供一种基于微博分析电视节目收视情况的方法。
本发明解决其技术问题所采用的技术方案是,一种基于微博分析电视节目收视情况的方法,包括以下步骤:
(1)构建词库:从搜狗细胞词库下载词库,将下载的词库组合在一起构成电视领域基本词库,并定期更新;
(2)建立微博-电视节目映射:首先建立节目样本库,根据样本特征词提取每日微博,对获取的微博进行过滤,采用数据分析开源工具中的文本处理包进行文本分类,由于文本处理包不支持中文,先把中文分词加入空格,“模拟”英文来实现分类;
(3)数据分析:对步骤(2)建立的微博-电视节目映射分别进行每日分析和多维分析,所述每日分析包括情感分析、词语特征分析和主题分析、每日基本统计以及网络特征分析。
(4)可视化结果展现:通过报表形式和图形形式将步骤(2)分析的结果展现出来;
步骤(2)中,所述建立节目样本库的方法,首先根据节目关键词,使用微博的搜索接口进行搜索,获取初始节目样本库;然后采用人工的方式,对初始节目样本库进行过滤,将过滤出的微博标注为“相关”和“不相关”两类,并将“相关”和“不相关”两类微博建立节目样本库微博,每个节目的样本库中要求“相关”的微博不少于2万条,“不相关”的微博不少于5000条;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王永恒,未经王永恒许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310328471.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种三工双向光收发模组
- 下一篇:一种用于板上芯片LED封装结构