[发明专利]基于电视观看日志挖掘的用户行为分析方法有效
申请号: | 201310032682.X | 申请日: | 2013-01-28 |
公开(公告)号: | CN103106615A | 公开(公告)日: | 2013-05-15 |
发明(设计)人: | 罗迪新;许洪腾;杨小康;解蓉;张文军 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;H04N21/462 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 电视 观看 日志 挖掘 用户 行为 分析 方法 | ||
技术领域
本发明涉及的是一种数据挖掘领域的方法,具体地说,涉及的是一种基于电视观看日志挖掘的用户行为分析方法。
背景技术
用户行为的分析和建模在现今的混合网络,尤其是社会网络的研究中具有重要意义。无处不在的低成本计算和通信技术使得人们以前所未有的规模访问和共享信息。如此大量的数据需要新的基于用户行为的分析研究以帮助我们理解这些内容。此外,受欢迎的网站与复杂的媒体的分享和通知功能允许用户和朋友和亲人保持联系;这些网站和通讯媒体也帮助用户形成显性和隐性的社会团体。这些社会群体是组织和管理多媒体数据的一个重要的信息来源。因此,针对用户群体行为的分析研究工作是重要而又必需的。
网络社交平台,如国外的Facebook、Twitter、Linkin以及国内的腾讯、网易微博、人人网等,容易上传、标签、分享和互动内容以及与其他用户交流;而另一些媒体平台,如IPTV、SITV、广播网,由媒体单向地向用户提供信息,用户之间、用户与媒体平台之间的交互较少或者没有。虽然各具特点,但这些媒体平台都提供了共享和交流的平台,导致文化以及相应的文化现象的迅速出现和传播,并形成各种社会群体。从这些社交媒体平台而来的信息——关于用户个人、他们在社交网络的交互,以及所属的社会结构——是理解复杂的网络社会现象的宝贵的资源。基于这些数据,我们可以提取用户行为模式,寻找相同用户,对用户进行分类,并根据这些分析结果加深对于人类行为和网络的理解和认识。
在过去几年中,对IPTV系统基础结构建设和服务的快速发展已经成为全球范围的趋势。为了优化IPTV系统,并保持市场的繁荣,基于用户个人的行为提供个性化服务,已经越来越重要。
大致上讲,用户可以按照他们不同的行为活动来分类。一个合适的用户活动模型可以准确表现用户行为,这对系统的设计和仿真很有意义。在关于社会网络的研究工作中,对用户活动建模已经有一批研究成果。DonaldE.Smith在《IEEE INFOCOM2007proceedings》的第2546页至第2550页发表的“IPTV Bandwidth Demand:Multicast and Channel Surfing”基于假设的用户模型,对整个系统的性能进行了分析。TongqingQiu等人在《Proceedings of the 9th ACM SIGCOMM conference on Internet measurement conference》的第430页至第441页发表的“Modeling User Activities in a Large IPTV System”针对IPTV系统进行分析。关于IPTV系统,包括频道访问频率,频道受欢迎程度,机顶盒的切换频率等特性,都已经被应用于分析用户的特性。以往的方法都遵循了以下思路:用户观看电视节目的行为被作为一种随机过程来进行建模;通过统计观看数据,从而估计这个随机过程的分布,然后分析用户行为;而检验模型的合理性时,是通过对比真实数据和生产模型分别产生的合成数据的统计相似度。
这种思路对系统的时变性能的建模是有用的,例如驻留时间,用户切换电视频道的频率,打开电视和关闭电视的时间,对某些电视频道的偏好等。但是,这些系统的时变特性不能够表示用户个人的行为。因此,以上的研究工作是针对于整个系统的性能的建模,而不是用户行为的建模。为了分析用户的行为,而非系统的时变特性,应更多地考虑用户的特性,并对用户稳定的特性和变化的特性建模。
另一方面,IPTV系统关于用户观看行为的记录数据属于高维度。对高维度数据进行聚类的方法有K-means、RANSAC、稀疏表示等。这些方法都需要事先知道数据应该被分为几个子空间,每个子空间的维度是多少。Liu等人在《IEEE Transaction on Pattern Analysis and Machine Intelligence》第35卷第1期的第171页至第184页发表的“Robust recovery of subspace structures by low-rank representation”提出一种基于低秩的聚类方法,可以达到对数据的鲁棒的和广义的聚类。
发明内容
针对现有技术中的缺陷,本发明的目的在于提出一种以用户观看电视节目行为特性为基础的用户行为分析方法,该方法根据用户观看电视节目的时间冗余和用户冗余特性,基于多级低秩模型,通过数据挖掘,更好地实现用户个人的行为分析,可用于对用户分类、用户家庭结构分析以及IPTV系统仿真。
本发明是通过以下技术方案实现的:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310032682.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:伤口引流控制设备
- 下一篇:用于电子单元的电连接的装置