[发明专利]基于大数据及文章标题结合的投放进度计算方法及系统有效
申请号: | 202110562046.2 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113032551B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 段小霞;赵郑;刘德恒;于言言 | 申请(专利权)人: | 北京泽桥传媒科技股份有限公司 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F16/35;G06F40/258;G06K9/62;G06Q30/02 |
代理公司: | 北京鼎德宝专利代理事务所(特殊普通合伙) 11823 | 代理人: | 牟炳彦 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 文章 标题 结合 投放 进度 计算方法 系统 | ||
1.基于大数据及文章标题结合的投放系统,其特征在于,所述系统包括以下部分:
文章获取与处理组件,所述文章获取与处理组件与特征关联组件相连,所述特征关联组件分别与中心聚合组件和强关联组件相连,所述强关联组件与中心聚合组件相连,所述中心聚合组件与文章库组件相连,所述文章库组件与广告处理组件相连,同时,广告输入组件也与广告处理组件相连,所述广告处理组件与投放规则设定组件相连,所述投放规则设定组件与投放进度计算组件相连,所述投放进度计算组件与所述文章库组件相连;
所述强关联组件,用于筛选出关联规则中的强关联规则,并设定判断条件,根据判断条件定义一个近似交集数;
所述中心聚合组件,用于合并每个特征的所有关联规则,根据每个特征的关联规则全集和近似交集数进一步计算每个特征的中心聚合度,选出聚类中心及每个特征的所属类别;
所述投放规则设定组件,用于设定广告投放规则;
所述投放进度计算组件,用于接收文章推广后台的数据,设定结算周期,计算每个结算周期的点击率,根据不同结算周期的广告点击率得到广告的动态投放进度,并判断当前结算周期的动态投放进度是否满足进度点期望值;
所述文章库组件对已投类别进行记录,并将剩余类别的文章标题特征发送给广告处理组件,重新计算广告对应的待投放文章池类别及相似特征,并根据广告投放规则重新投放;
所述文章获取与处理组件,用于抓取网络中最近固定时间段内的历史文章,对文章进行去噪等预处理,提取文章标题特征;
所述特征关联组件,用于计算文章标题特征之间的距离,得到特征之间的关联规则;
所述广告输入组件,输入广告主题,所述广告主题包括对当前广告优点、特点的描述信息;
所述广告处理组件,用于对广告主题进行特征提取,得到广告主题特征,计算每个广告主题特征与每个文章池类别的相关系数和距离,得到当前广告的总相关度,根据总相关度得到待投放的文章池类别及相似特征。
2.基于大数据及文章标题结合的投放进度计算方法,其特征在于,所述方法包括以下步骤:
步骤A.基于大数据抓取网络中的历史文章,提取文章标题特征,基于关联规则对文章标题特征进行聚类,形成文章库组件;
步骤B.确定广告主题,计算广告主题特征与文章库组件中各文章标题特征的相似度,得到广告的总相关度,选择待推广文章投放广告,统计文章推广后的阅读量和对应广告的点击量,得到每个结算周期的广告动态投放进度;
其中,对文章标题特征进行关联聚类,通过计算任意两个特征之间的距离得到两个特征之间的相似度,通过相似度阈值判断两个特征是否相似,得到关联规则;
首先设立是所有标题特征中的任意两项,两项之间的距离定义为:
其中,表示特征或特征在所有文章中共同出现的次数,表示特征在所有文章中出现的次数,表示特征在所有文章中出现的次数;若则表明特征与特征相关联,εDist为相似度阈值;形成关联规则:为关联规则的前件,为关联规则的后件;
当前广告主题特征与文章池类别的相关系数为:
当前广告的主题与不同文章池类别的距离为:
其中,Dist(X,y)表示广告主题与文章池类别y的距离,Dist(x,yj)为根据步骤A1的计算方法得到的任意一个广告主题特征x与任意一个文章标题类别yj的距离,X为广告主题特征数量,yj表示文章池类别y中任意一个文章标题类别,J表示文章池类别y中文章标题特征的数量,α1表示类别y包含特征x的概率,α2表示除类别y之外的其他类别包含特征x的概率,α3表示类别y不包含特征x的概率,α4表示除类别y之外的其他类别不包含特征x的概率;
遍历计算每个广告主题特征与每个文章池类别的相关系数和距离,得到当前广告的总相关度:
其中,Y为文章池类别数量。选取总相关度RC值最大的前m个文章池类别,去除m个文章池中距离大于阈值的特征,则剩余特征为所述广告的相似特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京泽桥传媒科技股份有限公司,未经北京泽桥传媒科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110562046.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置