[发明专利]一种电视用户收视偏好分析方法有效
申请号: | 201911314363.1 | 申请日: | 2019-12-19 |
公开(公告)号: | CN110996144B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 王宏志;丁小欧;张冠巍 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | H04N21/258 | 分类号: | H04N21/258;H04N21/25 |
代理公司: | 北京格允知识产权代理有限公司 11609 | 代理人: | 周娇娇 |
地址: | 150001 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电视 用户 收视 偏好 分析 方法 | ||
1.一种电视用户收视偏好分析方法,其特征在于,该方法包括如下步骤:
S1、从服务器获取待分析的数据,对数据进行格式整理及清洗,得到清洗后的数据条目;
S2、提取清洗后数据条目中出现的频道名称、节目名称,并对节目进行分类,归纳节目类别;
S3、将清洗后数据条目按频道名称分别存储,并根据时段对数据条目进行归类;
S4、选定时段,依据归纳得到的节目类别对存储的数据条目进行分类,统计所选时段内频道名称、节目名称、节目类别出现频次,得到相应的热点词统计报告;
S5、提取清洗后数据条目对应的用户列表,抽选用户;
S6、将所选用户对应的清洗后数据条目按照用户CA卡号分别存储,根据时段对数据条目进行归类,并按照时间顺序对事件标识排序,得到用户在各时段内的时序事件序列;
S7、根据所选用户对应的时序事件序列生成该用户的行为模式图;
S8、根据得到的行为模式图,提取体现偏好倾向的用户行为模式;
S9、基于相应的存储数据进行用户行为识别,根据识别结果分析所选用户偏好,得到用户收视偏好报告;
所述步骤S2中对节目进行分类,归纳节目类别,包括:
S2-1、根据频道名称确定频道类别,将专门类频道下的各个节目分入其频道对应的类别中;
S2-2、将综合类频道下各个节目,结合其节目名称中的关键词,分入相应的类别中;
所述步骤S2-1进一步包括,扫描数据条目,获取数据条目中的频道名称;若其属于专门类频道,则构成包含频道名称的元组,通过标签或索引的方式将各个元组与其对应的节目类别关联,建立一次分类知识库;若其不属于专门类频道,则继续执行步骤S2-2;
所述步骤S2-2进一步包括如下三部分:
建立词典、扫描数据条目,获取频道名称、节目名称,构成包含频道名称和节目名称的元组,以各元组作为键,建立词典,并统计各元组的出现频次,得到包括频次计数值的节目元组;
分词与合并、以天为单位,枚举词典中所有元素,使用NLP方法对节目名称进行分词处理,每个节目名称至少得到一个关键词;将各个关键词匹配到相应的节目元组中,形成包含频道名称、关键词和频次计数值的关键词元组;将频道名称和关键词均相同的关键词元组进行合并,频次计数值相加;
构成知识库、读取并合并所有日期下频道名称和关键词均相同的关键词元组,得到汇总后的关键词元组集合,通过标签或索引的方式将各个关键词元组与其对应的节目类别关联,建立二次分类知识库。
2.根据权利要求1所述的方法,其特征在于,
所述步骤S1中对数据进行清洗,包括剔除不可用错误项以及修复可用错误项;
其中,不可用错误项包括编码错误项、字段约束错误项;可用错误项包括字段文字明显错误项、字段部分内容丢失项。
3.根据权利要求1所述的方法,其特征在于,
所述步骤S4中,依据归纳得到的节目类别对存储的数据条目进行分类进一步包括:
S4-1、根据所选时段提取存储的数据条目,得到由频道名称和节目名称构成的节目二元组;
S4-2、在一次分类知识库中查询节目二元组中的频道名称,若存在,则返回该节目二元组对应的节目类别并结束,若不存在,则继续执行步骤S4-3;
S4-3、使用NLP方法对节目二元组中的节目名称进行分词,每个节目名称得到至少一个关键词;对于每个节目二元组,将频道名称与分词得到的各个关键词分别组成关键词二元组,在二次分类知识库中查询各个关键词二元组,返回关键词二元组对应的节目类别;将关键词二元组对应的节目类别逐个列出,并分别计算各节目类别对应频次在所有节目类别对应频次之和中所占比例,作为判断该节目二元组属于该节目类别的概率。
4.根据权利要求1所述的方法,其特征在于,
所述步骤S5中,在抽选用户前,统计各个用户的事件触发频次并设置抽样频次阈值;抽选用户时,根据事件触发频次及抽样频次阈值进行有选择抽样。
5.根据权利要求1所述的方法,其特征在于,
所述步骤S7中,生成行为模式图时,以事件标识作为节点、相邻事件先后顺序作为有向边,构建状态转移图,并设置初始频次阈值,删除状态转移图中出现频次低于初始频次阈值的边。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911314363.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吸气剂片托复合机
- 下一篇:一种自动射蜡模具设备