[发明专利]网络用户的人口属性预测方法和装置在审
申请号: | 201410515420.3 | 申请日: | 2014-09-29 |
公开(公告)号: | CN104317822A | 公开(公告)日: | 2015-01-28 |
发明(设计)人: | 王永杰;高翔;齐翔 | 申请(专利权)人: | 新浪网技术(中国)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市京大律师事务所 11321 | 代理人: | 方晓明 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 用户 人口 属性 预测 方法 装置 | ||
技术领域
本发明涉及互联网技术领域,尤其涉及一种网络用户的人口属性预测方法和装置。
背景技术
在计算广告学领域,定向广告就是将特定的网络广告发送给特定的人群。发布定向广告首先要制定定向条件,即确定将定向广告“发送给谁”。然后由广告发布系统根据定向条件确定目标人群并将广告发布出去。比如,针对年轻的学生推广一种快速消费品。定向广告一方面可以令广告主对目标人群进行重点宣传,避免了市场费用浪费在非目标人群上;另一方面也可以在一次广告活动中,对不同的人群采取不同的市场策略,以达到更好地广告效果。
其中,广告发布系统根据定向条件确定目标人群主要是根据网络用户的人口属性的统计特征来选取出符合定向条件的网络用户,将选取的这些网络用户作为目标人群进行广告投放。因此,在计算广告领域中网络用户的人口属性预测方面的研究是一项重要的研究内容。通常,网络用户的人口属性有多种,如性别、年龄、兴趣等。若在一个网页的广告位上,定向投放广告A到若干个性别为女性的网络用户,这些性别为女性的网络用户访问该网页时,该网页的广告位上便展示广告A。
目前的研究表明,网络用户的人口属性与其在网络上的浏览行为有很大的关系。针对网络用户的人口属性预测,现在比较通用的方法是根据待预测的网络用户的cookie,记录网络用户在网络上的行为信息,主要包括网络用户的cookie访问了哪些页面等,根据该网络用户访问的页面的人口属性,预测该网络用户的人口属性。具体地,现有的根据网络用户访问的页面的人口属性预测网络用户的人口属性的方法主要包括:对于待预测的网络用户所访问过的每个网页,根据访问该网页的人口属性已知的若干个网络用户的人口属性,确定该网页的人口属性;根据待预测的网络用户所访问的网页的人口属性,确定该网络用户的人口属性。然而,对于一些网页,这些网页的访问量可能较少(或称为数据缺失),导致访问这些网页的属性已知的网络用户也较少,进而会造成确定这些网页的人口属性的准确度不高,因而仅根据网络用户所访问过的网页的人口属性来确定网络用户的人口属性的方式准确度不高。
因此,有必要提供一种能够更为准确地对网络用户的人口属性进行预测的方法。
发明内容
针对上述现有技术存在的缺陷,本发明实施例提供了一种网络用户的人口属性预测方法和装置,用以提高网络用户的人口属性预测的准确度。
本发明实施例提供了一种网络用户的人口属性预测方法,包括:
确定网络用户在设定时间段内所访问的若干网页;
对于确定出的每个网页,确定每个网页的人口属性为特定属性值的概率,并确定每个网页所属频道的人口属性为所述特定属性值的概率;
根据每个网页的人口属性为特定属性值的概率、以及每个网页所属频道的人口属性为所述特定属性值的概率,预测所述网络用户的人口属性为所述特定属性值的概率。
较佳地,所述确定每个网页的人口属性为特定属性值的概率,具体包括:
对于确定出的每个网页,若该网页的访问量小于设定阈值,则根据该网页的特征向量计算该网页的人口属性为所述特定属性值的概率;若该网页的访问量大于等于所述设定阈值,则根据所述设定时间段内访问该网页的属性已知的网络用户的数量、以及访问该网页的人口属性为所述特定属性值的网络用户的数量,计算该网页的人口属性为所述特定属性值的概率;
所述确定每个网页所属频道的人口属性为所述特定属性值的概率,具体包括:
对于确定出的每个网页,根据访问该网页所属频道的人口属性已知的网络用户的数量、以及访问该网页所属频道的人口属性为所述特定属性值的网络用户的数量,计算该网页所属频道的人口属性为所述特定属性值的概率。
较佳地,所述确定每个网页的人口属性为特定属性值的概率还包括:
对于确定出的每个网页,所述得到该网页的人口属性为特定属性值的概率之后,统计所述设定时间段内访问该网页所在网站的人口属性已知的网络用户,计算其中人口属性为所述特定属性值的网络用户所占的比例,使用该比例对该网页的人口属性为所述特定属性值的概率进行纠正处理;
所述确定每个网页所属频道的人口属性为所述特定属性值的概率,还包括:
对于确定出的每个网页,得到该网页所属频道的人口属性为所述特定属性值的概率之后,统计所述设定时间段内访问该网页所属频道所在网站的人口属性已知的网络用户,计算其中人口属性为所述特定属性值的网络用户所占的比例,使用该比例对该网页所属频道的人口属性为所述特定属性值的概率进行纠正处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新浪网技术(中国)有限公司,未经新浪网技术(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410515420.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:打卷机
- 下一篇:钒氮合金全自动卸料装置