[发明专利]一种视频用户性别分类方法及其装置有效
申请号: | 201410037302.6 | 申请日: | 2014-01-26 |
公开(公告)号: | CN103729785A | 公开(公告)日: | 2014-04-16 |
发明(设计)人: | 房晓宇;江建博;朱凯泉;章岑;张缓迅;姚键;潘柏宇;卢述奇 | 申请(专利权)人: | 合一信息技术(北京)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 用户 性别 分类 方法 及其 装置 | ||
1.一种视频用户性别分类方法,包括如下步骤:
标签属性提取步骤:利用标定用户的观看记录,以及视频的标签信息,提取每一个标签观看人群的男女构成,将所述标签的男女观众所占比例作为所述视频的标签的标签属性,其中所述标定用户指的是已知性别的用户;
特性标签筛选步骤:根据所得到的标签属性,选择性别区分性显著地标签,作为特性标签,过滤掉没有区分性或者区分性小的标签;
标签特征定义步骤:针对每个特性标签的性别比例,得到所述特性标签的标签特征;
观看行为特征提取步骤:根据用户的观看记录,找到该用户一段时间内观看的所有视频,将这些视频对应到其各自的特性标签,利用所述特性标签的标签特征,来获得该用户这段时间内观看行为特征;
性别分类模型训练步骤:通过已知性别用户以及其在一段时间内观看行为特征,利用分类器训练得到性别分类模型;
性别分类预测步骤:对于每一个未知性别用户,利用其一段时间内观看行为特征,结合所述性别分类模型,判定其性别属性。
2.根据权利要求1所述的,其特征在于:
所述标签属性提取步骤,具体包括如下步骤:
首先,从带标签的视频库中,提取出每一个视频的所有标签,
然后,利用有标定的用户一段时间内的观看记录统计每一个标签上的不同性别的观看次数,
最后,计算每个标签的男女观看比例,从而得到所述标签属性;
所述特性标签筛选步骤,具体包括如下步骤:
首先,设定充分统计量阈值Nt,性别区分性阈值Pt,
然后,以所述标签的统计量作为统计量表述,以所述标签的男女所占比率的差的绝对值作为标签的区分性表述,
最后,分别将所述统计量表述与所述充分统计量阈值Nt做比较,所述区分性表述与性别区分性阈值Pt做比较,将区分性表述小于性别区分性阈值Pt或者所述统计量表述小于所述充分统计量阈值Nt的标签滤除,剩余的标签作为特性标签;
所述标签特征定义步骤具体为,利用公式(1)定义标签特征 ,
公式(1)
其中,标示观看该标签的男性比率,表示一段时间内该标签的男性观众观看次数,表示一段时间内该标签的总观看次数,0.5为归一化参数;
观看行为特征提取步骤,具体包括如下步骤:
首先统计用户在一段时间内,观看的视频,每个视频包括若干个标签,将视频对应到各自的特征标签,得到用户在该一段时间内的标签集合{tag1,...,tagm},利用公式(2)计算该用户的观看行为特征:
公式(2)
其中,为该用户在tagi上的观看次数,为该用户这段时间内总的观看次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一信息技术(北京)有限公司,未经合一信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410037302.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:治疗坐骨神经痛的中药组合物及其制备方法
- 下一篇:一种祛痘中药膏