[发明专利]一种节目标签关联规则分析系统及方法有效
申请号: | 201410713438.4 | 申请日: | 2014-11-28 |
公开(公告)号: | CN104363478A | 公开(公告)日: | 2015-02-18 |
发明(设计)人: | 殷复莲;柴剑平;王妍;潘幸艺;路璐;王欣然 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | H04N21/258 | 分类号: | H04N21/258;H04N21/466 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 陈英俊 |
地址: | 100024 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 节目 标签 关联 规则 分析 系统 方法 | ||
1.一种节目标签关联规则分析系统,包括:
节目标签采集单元,用于从存储节目信息的数据库或者网站上采集节目名称及其节目标签,其中,节目标签是对电视节目内容的多角度概括;
输入单元,用于输入确定广播电视用户收视偏好所需的至少一个节目名称、空间区域、时间区域并生成所述节目名称的节目标签数据源和上述空间区域和时间区域内所述节目名称的播放收视数据源调用指令;
节目标签数据库,接收节目标签采集单元采集的节目标签并按照节目名称对其进行汇总存储,并接收输入单元的上述调用指令导出所述节目标签数据源;
节目播放收视数据库,将各节目的播放信息和通过用户机顶盒的收视信号采集的用户对各节目的收看信息存储为播放收视数据源,并接收输入单元的上述调用指令导出所述播放收视数据源;
收视空间构造单元,接收节目标签数据库调出的节目标签数据源和节目播放收视数据库调出的播放收视数据源构造具有节目标签的收视空间;
节目标签关联规则分析单元,分析上述收视空间中各节目标签及其组合的支持度和置信度,输出满足最小支持度和最小置信度要求的节目标签及其组合的关联规则。
2.根据权利要求1所述的系统,其中,所述节目标签关联规则分析系统还包括:节目单制定单元,将产生关联规则的节目标签和节目标签组合排列形成电子节目单。
3.根据权利要求2所述的系统,其中,所述节目标签关联规则分析系统还包括:节目单发送单元,将所述电子节目单通过短信、微信、APP、邮件发送给节目制作商、节目发行商、电视台。
4.一种节目标签关联规则分析方法,包括:
通过节目标签采集单元采集节目名称及其节目标签,并按照节目名称对其进行汇总和存储;
通过输入单元输入确定用户偏好所需的至少一个节目名称、空间区域、时间区域并生成上述空间区域和时间区域内所述节目名称的节目标签数据源和播放收视数据源的调用指令;
根据输入单元的调用指令分别从节目标签数据库和节目播放收视数据库导出符合调用指令的节目标签数据源和播放收视数据源,并导入到收视空间构造单元;
利用上述数据源构造具有节目标签的收视空间;
对上述收视空间内的各节目标签及其组合的支持度和置信度进行分析,输出满足最小支持度和最小置信度要求的节目标签及其组合的关联规则。
5.根据权利要求4所述的方法,其中,所述节目标签关联规则分析方法还包括:将产生关联规则的节目标签和标签组合排列形成节目单。
6.根据权利要求所述的方法,其中,所述节目标签关联规则分析方法还包括:将节目单发送给节目制作商、节目发行商、电视台。
7.根据权利要求4所述的分群方法,其中,所述通过节目标签采集单元采集节目名称及其节目标签的方法包括:利用正则表示法从广播电视公司已有的节目数据库或者利用网站API接口从网站上或者利用网络爬虫从视频网站上采集节目名称及其节目标签,或者上述三种方式任意组合采集节目标签。
8.根据权利要求4所述的方法,其中,所述对上述收视空间内的各节目标签及其组合的支持度和置信度进行分析,输出满足最小支持度和最小置信度要求的节目标签及其组合的关联规则的方法包括:
扫描具有节目标签的收视空间,将支持度大于最小支持度阈值的每一个非零和非重叠节目标签纳入到标签频集;
扫描所述标签频集,得到上述节目标签频集中的节目标签的各种组合形式大于最小支持度阈值的各组合频集;
分别构造标签频集和各组合频集的非空真子集;
根据标签频集、各组合频集及其非空真子集得到各非空真子集的置信度;
判断所述真子集的置信度是否大于最小置信度阈值;
如果大于最小置信度阈值,则产生关联规则:说明产生关联规则的非空真子集中的节目标签或节目标签组合与该真子集的补集中的节目标签或者节目标签组合有较强的关联关系;
如果不大于最小置信度阈值,则不产生关联规则。
9.根据权利要求8所述的方法,其中,所述扫描所述标签频集,得到上述节目标签频集中的节目标签的各种组合形式大于最小支持度阈值的各组合频集的方法包括:
扫描标签频集,计算上述标签集中的任意两个节目标签组合的支持度,得到大于最小支持度阈值的两个节目标签组合的双组合频集;
扫描双组合频集,将双组合频集中任意两个元素合并,将合并后的组合中包含元素数不为3的组合删去,得到三个节目标签的组合;
判断上述每一个三个节目标签组合的具有两个元素的真子集是否均包含在双组合频集内;
若是三个节目标签组合的具有两个元素的真子集不全包含在双组合频集内,则删除该三个节目标签组合;
若是三个节目标签组合的具有两个元素的真子集均包含在双组合频集内,则计算满足上述要求的三个节目标签组合的支持度,得到大于最小支持度阈值的三个节目标签组合构成的三组合频集;
重复上述步骤,直到得到满足大于最小支持度阈值要求的标签频集中所有节目标签组合的组合频集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410713438.4/1.html,转载请声明来源钻瓜专利网。