[发明专利]一种互联网广告的流量匹配算法在审
申请号: | 201711109061.1 | 申请日: | 2017-11-11 |
公开(公告)号: | CN107895285A | 公开(公告)日: | 2018-04-10 |
发明(设计)人: | 彭蓉 | 申请(专利权)人: | 北京小子科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102200 北京市昌平区回龙观*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 广告 流量 匹配 算法 | ||
1.一种互联网广告的流量匹配算法,其特征在于,所述流量匹配算法包括文本相似度计算和地理信息挖掘计算;将通过文本相似度计算得到的文本相似度和通过地理信息挖掘计算得到的地理相似度进行线性组合,计算得到广告与文本的最终相似度;
所述文本相似度计算包括利用VSM计算网页与广告的文本相似度;
所述地理信息挖掘计算包括:通过TF*IDF加权选取特征,确定网页文本和广告文本中的关键词,之后对关键词做同义词、近义词上的语义扩展并估算特征权重;抽取地理特征,并分配地理范围,根据网页和广告的地理范围计算得到地理相似度。
2.根据权利要求1所述的流量匹配算法,其特征在于,所述抽取地理特征通过Yahoo的Place工具来获取网页中的地理位置;在分配地理范围时,网页中唯一地址为地理范围,若网页中出现多个地理位置,将多个地理位置按出现的频度由高到低排序,取频度最高的地理位置。
3.根据权利要求2所述的流量匹配算法,其特征在于,设地理位置和网页的相似度为tgr,tgr为人工设定值,其范围为0-1,当地理位置精确到市级以下时tgr为1,当地理位置精确到省级时tgr为0.5,当地理位置精确到国家级时tgr为0。
4.根据权利要求3所述的流量匹配算法,其特征在于,地理相似度的计算如下:其中,Sw为所属地理范围的面积,Sa为广告地理范围的面积,Dwa为两个地理范围的距离,为重叠面积的影响因子,β为表示距离的影响因子,Sw∩Sa表示网页地理范围和广告地理范围的重叠面积。
5.根据权利要求4所述的流量匹配算法,其特征在于,所述Place工具能够获得地理位置的中心纬度和经度,通过经纬度转化,地理位置可以计算成平面地图上的点坐标(x,y)值,地理位置的中心坐标表示为C(x,y),地理范围表示成由西南角和东北角两个点构成的坐标范围(SW(x1,y1),NE(x2,y2)),通过地理范围的坐标换算,得到Sw和Sa。
6.根据权利要求5所述的流量匹配算法,其特征在于,文本相似度的计算公式如下:其中,dj表示第j个网页文档,ak表示第k个广告文档,Wij表示网页文档dj中第i个关键词的权重,Wik表示广告文档ak中第i个关键词的权重。
7.根据权利要求6所述的流量匹配算法,其特征在于,最终相似度的计算公式如下:R=ts×(1-tgr)+gs×tgr,其中,ts为文本相似度,gs为地理相似度,tgr为地理位置和网页的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小子科技有限公司,未经北京小子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711109061.1/1.html,转载请声明来源钻瓜专利网。