[发明专利]广播电视用户收视行为预测方法及系统有效
申请号: | 201710386090.6 | 申请日: | 2017-05-26 |
公开(公告)号: | CN107241623B | 公开(公告)日: | 2019-08-02 |
发明(设计)人: | 殷复莲;白雪松;苏沛 | 申请(专利权)人: | 中国传媒大学 |
主分类号: | H04N21/258 | 分类号: | H04N21/258;H04N21/442 |
代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 张超艳;金凤华 |
地址: | 100024 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 广播电视 用户 收视 行为 预测 方法 系统 | ||
本发明提供广播电视收视行为预测方法及系统,方法包括:采集广播电视用户设定时间段内收视行为数据组成第一收视行为序列;采用至少一种序列长度将第一收视行为序列划分为多个第二收视行为序列;根据第二收视行为序列构建第一收视行为序列前缀树;将前缀树子树里每一个分支根节点代表收视行为与除去底层子节点的各子节点收视行为按照层顺序组成多个第三收视行为序列;基于SPEED算法、SPEED‑C算法、SPEED‑CR算法或者上述各算法与S‑Markov方法的结合预测第三收视行为序列后紧跟的收视行为的内部概率、逃逸概率和预测概率,得到最大预测概率对应的第三收视行为序列及其后紧跟的收视行为组合构成最佳收视行为序列。
技术领域
本发明涉及广播电视技术领域,更为具体地,涉及一种广播电视用户收视行为预测方法及系统。
背景技术
如今,传统电视媒体同互联网等新媒体一样,对自身平台的节目收视情况都格外看重。由于收视结果是海量用户行为的累积,所以对用户收视行为进行预测,将会从源头解释收视成因,也便于进一步采取措施吸引、培养、稳固住忠实用户,以守住盈利底线、制造更多潜在的营收途径。
SPEED算法(加强片段挖掘的序列预测)是以数据压缩领域的PPM型算法为基础、历经LeZi Update算法和ALZ(Active LeZi)算法改进而成的序列预测算法,其原理是对历史数据建立前缀树和有限阶马尔可夫模型,并利用PPM算法计算可能组合的预测概率,概率最大的组合即作为预测结果。
现有技术中,没有将SPEED算法应用到广播电视收视行为的预测,更加没有通过广播电视用户对节目或频道的收听情况,预测未来用户最喜爱的收视节目或频道组合。
发明内容
鉴于上述问题,本发明的目的是提供一种基于SPEED算法对广播电视用户的收视行为进行预测的广播电视用户收视行为预测方法及系统。
根据本发明的一个方面,提供一种广播电视用户收视行为预测方法,包括:步骤1,采集广播电视用户设定时间段内收视行为数据组成第一收视行为序列,所述收视行为包括收视指标、收听节目的标示符和收听频道的标示符中的一种或多种;步骤2,采用至少一种序列长度将所述第一收视行为序列划分为多个第二收视行为序列,所述第二收视行为序列的序列长度短于所述第一收视行为序列的序列长度;步骤3,根据第二收视行为序列构建第一收视行为序列的前缀树,包括:设定所述前缀树的最高层数,以第一收视行为序列中出现的每一个收视行为作为一个根节点,不大于所述最高层数的各第二收视行为序列中各种收视行为组合作为各分支,每一根节点与该根节点相连的各分支构成每一个子树,根节点代表的收视行为在第一收视行为序列中出现的频数为所述根节点的节点值,从根节点到子节点代表的收视行为组合在各第二收视行为序列中出现的频数之和为所述子节点的节点值;步骤4,将上述前缀树的子树里每一个分支的根节点代表的收视行为与除去底层子节点的各子节点代表的收视行为按照层顺序组成不同序列长度的多个第三收视行为序列;步骤5a,预测每一个第三收视行为序列下一次序的收视行为为所述第一收视行为序列中任一个收视行为的内部概率,所述内部概率按照下面的公式(1)和(2)计算,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国传媒大学,未经中国传媒大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710386090.6/2.html,转载请声明来源钻瓜专利网。