[发明专利]信息相关性分析方法和装置有效
申请号: | 201110049339.7 | 申请日: | 2011-03-01 |
公开(公告)号: | CN102654862A | 公开(公告)日: | 2012-09-05 |
发明(设计)人: | 朱建朋;李佳 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 相关性 分析 方法 装置 | ||
技术领域
本发明涉及通信技术领域,特别涉及一种信息相关性分析方法和装置。
背景技术
随着互联网技术的发展,网络作为一种新兴媒体成为广告发布的新平台。与传统媒体发布广告相比,网络广告具有高针对性,传播速度快等优点。在搜索引擎广告的投放过程中,可以根据来访者的检索意图,具有针对性的进行广告投放,在一定程度上保证了广告的到达率。为了使网络广告能够按照来访者的检索意图更加准确的投放,各互联网公司会对自有的搜索引擎广告投放系统进行广告相关性分析。
现有技术中各互联网公司对自有搜索引擎广告投放系统的广告相关性分析,一般采用的是从检索日志中随机抽取一部分用户曾经进行检索的检索串,然后到自有的搜索引擎中检索抽取的检索串,查看所展示的广告与用户的检索意图是否相一致。最后根据这些抽样的广告相关性作为自有搜索引擎广告投放系统的广告相关性。
现有技术中在广告相关性分析费用有限制的情况下,采用随机抽取用于检验广告相关性的样本,这种方法抽取的样本与总体分布有可能不一致,使得抽样的误差较大,因此增大了误差的方差,最终得到的广告相关性分析指标也不一定能代表总体的相关性。若使随机抽取的样本尽可能的与总体分布一致,达到减少误差的目的,则要增大样本容量,因此会增加广告相关性的分析费用。
发明内容
为了解决现有技术中用于分析的抽样样本误差大,无法代表总体分布情况的问题,本发明实施例提供了一种信息相关性分析方法和装置。所述技术方案如下:
本发明实施例提出了一种信息相关性分析方法,包括:
根据预设条件对检索串进行分层;
根据分层后的检索串获取用于分析的抽样检索串;
获取所述用于分析的抽样检索串对应的数据;
根据所述获取的数据对信息相关性进行分析。
作为上述技术方案的优选,所述根据预设条件对所有的检索串进行分层,具体包括:
将检索串的词频、串长作为预设条件对检索串进行分层。
作为上述技术方案的优选,所述根据分层后的检索串获取用于分析的抽样检索串,具体包括:
根据历史数据计算用于分析的抽样检索串总容量;
按照所述抽样检索串总容量,采用奈曼分配分别计算每个分层的抽样检索串容量;
按照所述每个分层的抽样容量,随机抽取抽样检索串。
作为上述技术方案的优选,所述根据历史数据计算用于分析的抽样检索串总容量,具体包括:
根据分层后每层中包含传统的随机抽样分析方式获得的检索串度量指标来计算每层的方差;
根据每层的方差计算用于分析的抽样检索串总容量。
本发明实施例还提出了一种信息相关性分析装置,包括:
分层模块,用于根据预设条件对所有的检索串进行分层;
第一获取模块,用于根据分层后的检索串获取用于分析的抽样检索串;
第二获取模块,用于获取所述用于分析的抽样检索串对应的数据;
分析模块,用于根据所述获取的数据对信息相关性进行分析。
作为上述技术方案的优选,所述分层模块具体包括:
按照检索串的词频、串长作为预设条件进行分层。
作为上述技术方案的优选,所述第一获取模块包括:
第一计算单元,用于根据历史数据计算用于分析的抽样检索串总容量;
第二计算单元,用于按照所述抽样检索串总容量,采用奈曼分配分别计算每个分层的抽样检索串容量;
抽取单元,用于按照所述每个分层的抽样容量,随机抽取抽样检索串。
作为上述技术方案的优选,所述第一计算单元包括:
第一计算子单元,用于根据分层后每层中包含传统的随机抽样分析方式获得的检索串度量指标来计算每层的方差;
第二计算子单元,用于根据每层的方差计算用于分析的抽样检索串总容量。
本发明实施例提供的技术方案的有益效果是:通过根据预设条件对所有的检索串进行分层,根据分层后的检索串获取用于分析的抽样检索串,获取所述用于分析的抽样检索串对应的数据,根据所述获取的数据对信息相关性进行分析。实现了通过分层抽样增大层间方差,降低增内方差的方式,降低了抽样检索串的误差,使得抽取的检索串可以与总体分布大致一致,最终得到的分析指标也可以代表总体的相关性,达到了从抽样看总体的目的。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110049339.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:荧光自发电电动车
- 下一篇:城市轨道交通用低速大推力永磁游标直线电机
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置