[发明专利]一种对网络广告进行排序的方法有效
申请号: | 200710117607.8 | 申请日: | 2007-06-20 |
公开(公告)号: | CN101097580A | 公开(公告)日: | 2008-01-02 |
发明(设计)人: | 郑峰 | 申请(专利权)人: | 精实万维软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中科专利商标代理有限责任公司 | 代理人: | 周国城 |
地址: | 100085北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络广告 进行 排序 方法 | ||
1、一种对网络广告进行排序的方法,其特征在于,该方法包括:
利用广告监控程序从网站获取广告数据,从获取的广告数据中提取出广告主的信息和广告描述信息,该步骤具体包括:
利用广告监控程序蜘蛛spider监控各个网站的广告投放情况,并
将原始网页内容作为网页快照保存到网页快照库中;
对网页快照库中保存的广告数据中的文字信息进行分词,得到一组文本向量;
根据所述文本向量的特征,对所述文本向量进行向量加权或向量减权;
采用空间向量模型计算所述进行了向量加权或向量减权后的文本向量的权重;
对计算出来的文本向量的权重进行排序,并根据文本向量所在网页中的上下文信息,从网页中提取出广告主的信息和广告描述信息;
分别对广告主的信息和广告描述信息进行分词得到关键词,建立该关键词的索引;
计算每个建立索引的关键词的相关性,按照计算的相关性从高到低对网络广告进行排序。
2、根据权利要求1所述的对网络广告进行排序的方法,其特征在于,所述对网页快照库中保存的广告数据中的文字信息进行分词包括:将现代汉语的普通字序列文本分解为词序列的文本。
3、根据权利要求1所述的对网络广告进行排序的方法,其特征在于,所述对文本向量进行向量加权或向量减权的步骤包括:
对出现在标题中的文本向量,将向量权重增至原来的5至10倍;
对出现在网页结构中内容content的简介的文本向量,将向量权重增至原来的2至3倍;
对出现在网页内容中版权信息类的文本向量,将向量权重增至原来的3至5倍;
对出现在网页内容中与广告主的信息有关的文本向量,将向量权重增至原来的3至5倍;
对出现的包含在停词表中的文本向量,将向量权重减至原来的1/5至1/10。
4、根据权利要求1所述的对网络广告进行排序的方法,其特征在于,所述空间向量模型采用以下公式来表征:
其中,为词t在文本中的权重,而为词t在文本中的词频,N为训练文本的总数,nt为训练文本集中出现t的文本数,分母为归一化因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于精实万维软件(北京)有限公司,未经精实万维软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710117607.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可充分润滑变速齿轮的变速箱
- 下一篇:斜管式旋转布料机