[发明专利]基于三支决策理论进行特征交互选择的点击率预估模型在审
申请号: | 202110622654.8 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113327131A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 谢珺;赵旭栋;续欣莹;李小飞 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 太原市科瑞达专利代理有限公司 14101 | 代理人: | 王思俊 |
地址: | 030024 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策 理论 进行 特征 交互 选择 点击率 预估 模型 | ||
基于三支决策理论进行特征交互选择的点击率预估模型,计算广告和推荐系统中的点击率预估任务,它包括:1)利用One‑hot编码和Embedding技术处理输入分类特征;2)利用因子分解机及其衍生模型对原始数据的特征进行交互;3)利用三支决策理论结合二分类Sigmoid函数提出的三支决策门对交互特征进行选择;4)将经过三支决策门选择后的交互特征与数据原有特征通过逻辑斯蒂回归函数输出最后预测的点击率。本发明能够减少过多的冗余交互特征给原有模型带来的噪声信息,在一定程度上强化重要特征交互,保留一般重要交互特征,剔除冗余的交互特征。本发明提升因子分解机及其衍生模型的表现,同时降低了模型的训练时间。
技术领域
本发明属于计算广告及推荐系统领域,具体涉及点击率预估中交互特征,特别涉及一种基于三支决策理论进行特征交互选择的点击率预估模型。
背景技术
在推荐系统和在线广告中,确定某一用户对指定商品或者广告的点击概率是一项重要的任务,它决定了推荐系统的准确性和在线广告收入。在推荐系统的Top-N推荐中,用户对某个商品的点击率是一个重要的排序依据,这个点击概率决定商品在推荐列表中的位置,系统往往偏向把点击率较大的商品放置在推荐列表中的前列,以提升个性化推荐的准确性。在线广告中,广告曝光千次的点击率也是广告提供者衡量某个广告位的一项重要指标,广告商往往会根据千次点击率对平台的广告位置进行估值,拥有较高的曝光千次点击率的广告位往往能获得更多的利润。因此,点击率(Click-Through Rate,CTR)预估任务在推荐系统和在线广告中扮演着至关重要的角色。
在现有的CTR预估模型与算法中,为了提升模型的准确性,往往会利用向量积来学习异构信息,这些异构信息又叫特征交互或者组合特征,它们是在原有特征的基础上产生的。因式分解机及其衍生模型就是其中的主流模型,但是并非所有的特征交互都是有用的,学习所有的特征交互可能会引入毫不相关的冗余信息,这些信息会给模型带来噪声,给模型带来冗余负担,增加了训练模型的复杂度。这些冗余的交互特征会极大的影响模型的表现和效率,也给模型的线下训练和线上部署带来了极大的困难。
因此,如果能够基于现有的因子分解机及其衍生的点击率预估模型结构,加入预先识别有用的特征交互的模块,那么就可以移除无用的噪声交互特征专注的学习有用的交互特征,在提升模型表现的同时降低模型的训练复杂度,对在线广告平台和电商平台有着重要的应用价值。
发明内容
为解决上述问题,本发明提供一种基于三支决策理论进行特征交互选择的点击率预估模型,既能够实现更加精准的点击率预估,又能在模型复杂度上满足线上和线下的需求,为在线广告平台和电商平台提供了一种较好的点击率预估模型。
本发明采的技术方案主要包括以下几个步骤:
S1、数据预处理:原始数据存在隐式反馈与显式反馈两种情况。对于显式反馈直接用点击情况进行标注;对于隐式反馈,采用阈值法进行标注,即反馈分数超过某一阈值即标注为点击,阈值根据不同数据的评分范围来划分。最后将分类特征利用One-hot编码和Embedding转换为向量;
S2、交互特征:即采用因子分解机及其衍生模型的方式对向量化的分类特征进行交互,得到交互特征;
S3、选择交互特征:即利用三支决策理论结合Sigmoid函数提出的三支决策门函数对交互特征进行选择,剔除冗余的交互特征,保留重要的交互特征;
S4、输出结果:利用选择后的交互特征和原始特征,交互特征是经过三支决策门选择后的特征,最后经过逻辑斯蒂回归函数得到最后的点击概率;
特别的,图2给出了三支决策门选择交互特征的一般过程,所述的步骤为:
步骤1:确定三支决策门的超参数α和β。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110622654.8/2.html,转载请声明来源钻瓜专利网。