[发明专利]电视用户画像的构建方法有效
申请号: | 201710343327.2 | 申请日: | 2017-05-16 |
公开(公告)号: | CN107124653B | 公开(公告)日: | 2020-09-29 |
发明(设计)人: | 韩亚;尹娟;李足红 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | H04N21/45 | 分类号: | H04N21/45;H04N21/25;H04N21/258 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 袁辰亮;刘渝 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电视 用户 画像 构建 方法 | ||
1.一种电视用户画像的构建方法,其特征在于:所述的方法包括以下步骤:
步骤一、通过数据平台采集电视终端用户的数据并解析分类;将采集的数据分为三类,包括:A类:用户的基本属性数据;B类:直接通过用户点击得到的用户数据;C类:用户通过语音功能观看的电视数据;
步骤二、根据电视用户的行为数据预定义电视用户画像标签;
步骤三、对获取的B类数据进行匹配分类,构建B类数据电视用户画像一级标签,具体包括:步骤1,定时解析更新媒资平台的数据,并将该数据放到媒资数据库中;
步骤2,当B类数据中有对应的序列号的视频信息时,直接与媒资数据库的数据信息的序列号进行匹配,得到用户观看视频信息的具体信息;当B类数据中仅有具体的名称信息时,根据名称或者名字本身的数据与媒资数据库中数据进行匹配对其进行分类;
步骤四、对获取的C类数据进行分类,构建C类数据电视用户画像一级标签;
步骤五、根据B类数据和C类数据分别构建B类数据电视用户画像二级标签和C类数据电视用户画像二级标签;
步骤六、将电视用户画像每类数据的一级标签和二级标签进行合并统计,计算每类数据的一级标签和二级标签对应的视频信息观看的总次数和总时长,以及统计每类数据中二级标签信息的频次;
步骤七、根据统计的数据,分析电视用户的节目类型偏好属性数据,并根据所述偏好属性数据构建电视用户画像标签;
步骤八、将构建的电视用户画像标签更新预定义的电视用户画像标签。
2.根据权利要求1所述的电视用户画像的构建方法,其特征在于所述的步骤一包括:对采集的数据通过Hadoop中的MapReduce框架解析采集到的源数据,提取用户的信息。
3.根据权利要求1所述的电视用户画像的构建方法,其特征在于所述的步骤四包括:
步骤a, 根据媒资数据库本身的分类标签,分别构造节目类型的用户词典,并定时更新;
步骤b,对于电视中的应用,则根据启动应用的关键词识别为应用的类型。
4.根据权利要求3所述的电视用户画像的构建方法,其特征在于所述的步骤四还包括:当至少两种类型的词典同时包含用户所说的内容时,则需对所述至少两种类型词典设定优先级,优先匹配级别高的词典信息。
5.根据权利要求1所述的电视用户画像的构建方法,其特征在于所述的步骤五还包括:对电视用户每天所看的内容提取对应的标签,并定时更新,放到数据库中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710343327.2/1.html,转载请声明来源钻瓜专利网。