[发明专利]一种互联网广告的流量匹配算法在审
申请号: | 201711109061.1 | 申请日: | 2017-11-11 |
公开(公告)号: | CN107895285A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 彭蓉 | 申请(专利权)人: | 北京小子科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平区回龙观*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 广告 流量 匹配 算法 | ||
技术领域
本发明涉及互联网广告领域,具体地,涉及一种互联网广告的流量匹配算法。
背景技术
从广告诞生之日起,众多的广告主就一直在努力寻找一种更高性价比,更精准的广告形式。传统广告风行上百年,但随着受众(广告传播对象)碎片化的趋势日益加剧,传统广告业已日益不能满足广告主更精细化,更集约的广告需求,于是以精准为特点的新媒体逐渐崛起,而网络媒体是其中的佼佼者互联网被称为继报纸、广播电视三大传统媒体之后的第四媒体,基于互联网的网络媒体集三大传统媒体的诸多优势为一体,是跨媒体的数字化媒体。广告的目的是宣传产品或服务,而这些产品或服务基本都是由实体店在经营,并且相同品种的产品可能有不同的产地,同一家连锁店在不同地理位置可能有截然不同的运营团队和活动,不同产地出产的产品可能也有品质差别,基于此,一方面,广告商更愿意对一定区域内的潜在用户定向投放广告,并通过突出地理位置使自身广告与其他产品区别开来,另一方面,用户可能只对某一区域的服务或产品感兴趣。将地理信息与内容定向广告结合起来,能够更准确地挖掘受众的真实需求,从而使广告取得更好的效果。
发明内容
本发明的目的是提供一种互联网广告的流量匹配算法,该流量匹配算法能够将地理信息与内容定向广告结合起来,能够更准确地挖掘受众的真实需求,从而使广告取得更好的效果。
为了实现上述目的,本发明提供了一种互联网广告的流量匹配算法,所述流量匹配算法包括文本相似度计算和地理信息挖掘计算;将通过文本相似度计算得到的文本相似度和通过地理信息挖掘计算得到的地理相似度进行线性组合,计算得到广告与文本的最终相似度;
所述文本相似度计算包括利用VSM计算网页与广告的文本相似度;
所述地理信息挖掘计算包括:通过TF*IDF加权选取特征,确定网页文本和广告文本中的关键词,之后对关键词做同义词、近义词上的语义扩展并估算特征权重;抽取地理特征,并分配地理范围,根据网页和广告的地理范围计算得到地理相似度。
优选地,所述抽取地理特征通过Yahoo的Place工具来获取网页中的地理位置;在分配地理范围时,网页中唯一地址为地理范围,若网页中出现多个地理位置,将多个地理位置按出现的频度由高到低排序,取频度最高的地理位置。
优选地,设地理位置和网页的相似度为tgr,tgr为人工设定值,其范围为0-1,当地理位置精确到市级以下时tgr为1,当地理位置精确到省级时tgr为0.5,当地理位置精确到国家级时tgr为0。
优选地,地理相似度的计算如下:其中,Sw为所属地理范围的面积,Sa为广告地理面积的范围,Dwa为两个地理范围的距离,为重叠面积的影响因子,β为表示距离的影响因子,Sw∩Sa表示网页地理范围和广告地理范围的重叠面积。
优选地,所述Place工具能够获得地理位置的中心纬度和经度,通过经纬度转化,地理位置可以计算成平面地图上的点坐标(x,y)值,地理位置的中心坐标表示为C(x,y),地理范围表示成由西南角和东北角两个点构成的坐标范围(SW(x1,y1),NE(x2,y2)),通过地理范围的坐标换算,得到Sw和Sa。
优选地,文本相似度的计算公式如下:其中,dj表示第j个网页文档,ak表示第k个广告文档,Wij表示网页文档dj中第i个关键词的权重,Wik表示广告文档ak中第i个关键词的权重。
优选地,最终相似度的计算公式如下:R=ts×(1-tgr)+gs×tgr,其中,ts为文本相似度,gs为地理相似度,tgr为地理位置和网页的相似度。
根据上述技术方案,本发明提供了一种互联网广告的流量匹配算法,所述流量匹配算法包括文本相似度计算和地理信息挖掘计算;将通过文本相似度计算得到的文本相似度和通过地理信息挖掘计算得到的地理相似度进行线性组合,计算得到广告与文本的最终相似度;所述文本相似度计算包括利用VSM计算网页与广告的文本相似度;所述地理信息挖掘计算包括:通过TF*IDF加权选取特征,确定网页文本和广告文本中的关键词,之后对关键词做同义词、近义词上的语义扩展并估算特征权重;抽取地理特征,并分配地理范围,根据网页和广告的地理范围计算得到地理相似度。本发明提供的互联网广告的流量匹配算法,结合地理信息的广告对区域经营的产品具有很大意义,符合广告商要求和用户兴趣,具有较大的应用价值,从用户查询关键词的角度将地理信息和文本主题较好地结合起来,根据网页文本提取主题和地理信息,再匹配高相似度的广告,能够更准确地挖掘受众的真实需求,从而使广告取得更好的效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小子科技有限公司,未经北京小子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711109061.1/2.html,转载请声明来源钻瓜专利网。