[发明专利]用户属性信息提取方法及其系统有效
申请号: | 201410220854.0 | 申请日: | 2014-05-23 |
公开(公告)号: | CN103984741A | 公开(公告)日: | 2014-08-13 |
发明(设计)人: | 房晓宇;江建博;朱凯泉;章岑;张缓迅;姚键;潘柏宇;卢述奇 | 申请(专利权)人: | 合一信息技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 属性 信息 提取 方法 及其 系统 | ||
技术领域
本申请涉及数字信息提取,具体地说,涉及一种用户属性信息提取方法及其系统。
背景技术
随着互联网用户数量的递增,越来越多的商家将目光由传统媒体,例如,电视、报纸、杂志等转向互联网。举例而言,商家在用户浏览网页、观看视频、社交聊天时会以某种不影响用户使用的模式投放服务信息,例如弹出小窗口、网页的小区域滚动播放等。不同用户其感兴趣的服务信息也会不同,例如年轻男性偏向电子产品、年轻女性则对护肤品更有兴趣、中年用户对资产增值感兴趣、而老年用户则更关注保健产品。换句话说,用户的属性(例如,性别、年龄、收入、职业、受教育程度等)会反映其作为消费者的基本特点,会直接决定服务信息的投放效果。但由于使用习惯等问题,大多数用户不会登陆去使用互联网,因此并不能从登陆信息中预先得知用户的属性,从而使得所投放服务信息的受众变得随机和不确定,其效果也随之变得不确定。
因此亟需一种数字信息提取方法,使得服务信息投放更有针对性以达到最优的投放效果。
发明内容
有鉴于此,本发明提供一种用户属性信息提取方法及其系统以解决上述问题。
为解决上述问题,本发明提供了一种用户属性信息提取系统包括:用户信息处理模块,用以接收用户输入,并从该用户输入中提取用户观看信息和/或用户属性信息;视频信息处理模块,用以接收该用户观看信息,依据该用户观看信息提取视频对应的视频描述词;以及学习模块,用以接收该用户属性信息和该视频描述词,用以依据该用户属性信息和该视频描述词产生该视频描述词所对应的用户属性概率分布。
其中,所述视频信息处理模块包括对照表和视频描述词提取模块,所述对照表表示该视频与该视频描述词之间的对照关系;所述视频提取模块用以接收该用户观看信息,并依据该用户观看信息从该对照表中提取该视频对应的该视频描述词。
其中,所述学习模块为强化学习模块,该强化学习模块进一步包括:统计分析模块,用于接收该用户属性信息和该视频描述词以产生初步用户属性概率分布;用户浏览行为特征提取模块,用于基于该初步用户属性概率分布提取用户浏览行为特征;用户属性分类模型确定模块,用以依据已知属性用户的该用户浏览行为特征确定用户属性分类模型;用户属性预测模块,用以依据未知属性用户的该用户浏览行为特征以及该用户属性分类模型对该未知属性用户进行预测判别,以产生该未知属性用户的用户属性预测结果;以及筛选模块,用以对该用户属性预测结果进行筛选,其中该筛选后的用户属性预测结果被反馈至该统计分析模块用以校正该初步用户属性概率分布。
所述用户属性分类模型确定模块,用以依据该已知属性用户的该用户浏览行为特征使用机器学习算法进行该用户属性分类模型的学习,以产生该用户属性分类模型。
所述用户观看信息为预设时间内的用户观看信息。
所述用户属性为用户的性别、年龄、收入、职业和/或受教育程度。
为解决上述问题,本发明还提供了用户属性信息提取方法包括以下步骤:接收用户输入;从该用户输入中提取用户观看信息和/或用户属性信息;依据该用户观看信息提取视频对应的视频描述词;以及依据该用户属性信息和该视频描述词产生该视频描述词所对应的用户属性概率分布。
用户属性信息提取方法进一步包括:提供对照表,其中该对照表表示该视频与该视频描述词之间的对应关系;依据该用户观看信息从该对照表中提取该视频对应的该视频描述词。
其中依据该用户属性信息和该视频描述词产生该视频描述词所对应的用户属性概率分布的步骤进一步包括:依据该用户属性信息和该视频描述词以产生初步用户属性概率分布;基于该初步用户属性概率分布提取用户浏览行为特征;依据已知属性用户的该用户浏览行为特征确定用户属性分类模型; 依据未知属性用户的该用户浏览行为特征以及该用户属性分类模型对该未知属性用户进行预测判别,以产生该未知属性用户的用户属性预测结果;对该用户属性预测结果进行筛选,反馈该筛选后的用户属性预测结果以校正该初步用户属性概率分布。
依据已知属性用户的该用户浏览行为特征确定用户属性分类模型的步骤进一步包括:依据该已知属性用户的该用户浏览行为特征使用机器学习算法进行该用户属性分类模型的学习,以产生该用户属性分类模型。
与现有技术相比,本申请所述的用户属性信息提取方法及其系统,达到了如下效果:
(1)本发明可得到观看视频的用户属性概率分布,可依据用户属性概率分布来选择提供用户感兴趣的服务信息内容,并为其提供更广泛的个性化服务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合一信息技术(北京)有限公司,未经合一信息技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410220854.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于灰色架空绝缘料生产的真空干燥机加热装置
- 下一篇:一种无水氯化钙烘干装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置