[发明专利]用户属性信息提取方法及其系统有效

专利信息
申请号: 201410220854.0 申请日: 2014-05-23
公开(公告)号: CN103984741A 公开(公告)日: 2014-08-13
发明(设计)人: 房晓宇;江建博;朱凯泉;章岑;张缓迅;姚键;潘柏宇;卢述奇 申请(专利权)人: 合一信息技术(北京)有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用户 属性 信息 提取 方法 及其 系统
【说明书】:

技术领域

本申请涉及数字信息提取,具体地说,涉及一种用户属性信息提取方法及其系统。

背景技术

随着互联网用户数量的递增,越来越多的商家将目光由传统媒体,例如,电视、报纸、杂志等转向互联网。举例而言,商家在用户浏览网页、观看视频、社交聊天时会以某种不影响用户使用的模式投放服务信息,例如弹出小窗口、网页的小区域滚动播放等。不同用户其感兴趣的服务信息也会不同,例如年轻男性偏向电子产品、年轻女性则对护肤品更有兴趣、中年用户对资产增值感兴趣、而老年用户则更关注保健产品。换句话说,用户的属性(例如,性别、年龄、收入、职业、受教育程度等)会反映其作为消费者的基本特点,会直接决定服务信息的投放效果。但由于使用习惯等问题,大多数用户不会登陆去使用互联网,因此并不能从登陆信息中预先得知用户的属性,从而使得所投放服务信息的受众变得随机和不确定,其效果也随之变得不确定。

因此亟需一种数字信息提取方法,使得服务信息投放更有针对性以达到最优的投放效果。

发明内容

有鉴于此,本发明提供一种用户属性信息提取方法及其系统以解决上述问题。

为解决上述问题,本发明提供了一种用户属性信息提取系统包括:用户信息处理模块,用以接收用户输入,并从该用户输入中提取用户观看信息和/或用户属性信息;视频信息处理模块,用以接收该用户观看信息,依据该用户观看信息提取视频对应的视频描述词;以及学习模块,用以接收该用户属性信息和该视频描述词,用以依据该用户属性信息和该视频描述词产生该视频描述词所对应的用户属性概率分布。

其中,所述视频信息处理模块包括对照表和视频描述词提取模块,所述对照表表示该视频与该视频描述词之间的对照关系;所述视频提取模块用以接收该用户观看信息,并依据该用户观看信息从该对照表中提取该视频对应的该视频描述词。

其中,所述学习模块为强化学习模块,该强化学习模块进一步包括:统计分析模块,用于接收该用户属性信息和该视频描述词以产生初步用户属性概率分布;用户浏览行为特征提取模块,用于基于该初步用户属性概率分布提取用户浏览行为特征;用户属性分类模型确定模块,用以依据已知属性用户的该用户浏览行为特征确定用户属性分类模型;用户属性预测模块,用以依据未知属性用户的该用户浏览行为特征以及该用户属性分类模型对该未知属性用户进行预测判别,以产生该未知属性用户的用户属性预测结果;以及筛选模块,用以对该用户属性预测结果进行筛选,其中该筛选后的用户属性预测结果被反馈至该统计分析模块用以校正该初步用户属性概率分布。

所述用户属性分类模型确定模块,用以依据该已知属性用户的该用户浏览行为特征使用机器学习算法进行该用户属性分类模型的学习,以产生该用户属性分类模型。 

所述用户观看信息为预设时间内的用户观看信息。

所述用户属性为用户的性别、年龄、收入、职业和/或受教育程度。

为解决上述问题,本发明还提供了用户属性信息提取方法包括以下步骤:接收用户输入;从该用户输入中提取用户观看信息和/或用户属性信息;依据该用户观看信息提取视频对应的视频描述词;以及依据该用户属性信息和该视频描述词产生该视频描述词所对应的用户属性概率分布。

用户属性信息提取方法进一步包括:提供对照表,其中该对照表表示该视频与该视频描述词之间的对应关系;依据该用户观看信息从该对照表中提取该视频对应的该视频描述词。

其中依据该用户属性信息和该视频描述词产生该视频描述词所对应的用户属性概率分布的步骤进一步包括:依据该用户属性信息和该视频描述词以产生初步用户属性概率分布;基于该初步用户属性概率分布提取用户浏览行为特征;依据已知属性用户的该用户浏览行为特征确定用户属性分类模型; 依据未知属性用户的该用户浏览行为特征以及该用户属性分类模型对该未知属性用户进行预测判别,以产生该未知属性用户的用户属性预测结果;对该用户属性预测结果进行筛选,反馈该筛选后的用户属性预测结果以校正该初步用户属性概率分布。

依据已知属性用户的该用户浏览行为特征确定用户属性分类模型的步骤进一步包括:依据该已知属性用户的该用户浏览行为特征使用机器学习算法进行该用户属性分类模型的学习,以产生该用户属性分类模型。 

与现有技术相比,本申请所述的用户属性信息提取方法及其系统,达到了如下效果:

(1)本发明可得到观看视频的用户属性概率分布,可依据用户属性概率分布来选择提供用户感兴趣的服务信息内容,并为其提供更广泛的个性化服务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一信息技术(北京)有限公司,未经合一信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410220854.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top