[发明专利]信息点击率的确定方法、装置、计算机设备和存储介质有效
申请号: | 202110351765.X | 申请日: | 2021-03-31 |
公开(公告)号: | CN112801425B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 王韵陶;陈炳文 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06F40/289 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晶晶;杨欢 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息 点击率 确定 方法 装置 计算机 设备 存储 介质 | ||
1.一种信息点击率的确定方法,其特征在于,所述方法包括:
获取与推广信息对应的推广描述内容和推广属性数据,并获取与用户对象对应的用户相关数据,所述用户相关数据至少包括用户属性数据;
对所述推广描述内容进行分词处理,得到对应的词序列;
基于预先构建的目标词向量字典确定与所述词序列中每个词分别对应的词向量权重,以将所述词序列中的每个词分别映射至对应的向量空间,得到各个词分别对应的词嵌入特征;所述目标词向量字典用于表征各候选词的词向量权重;
对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征;
基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,所述信息点击率表征所述用户对象点击所述推广信息的概率;
其中,所述目标词向量字典的构建步骤包括:对与样本推广信息对应的样本推广描述内容进行分词处理,得到对应的样本分词,从各所述样本分词中选取输入词和相应的关联词,所述关联词为所述输入词的上文词或下文词;
将所述输入词输入待训练的词向量模型,基于所述待训练的词向量模型中的初始词向量字典,预测各个候选词对应所述关联词的关联概率;
基于所述关联概率对所述待训练的词向量模型中的始词向量字典进行调整,得到目标词向量字典。
2.根据权利要求1所述的方法,其特征在于,所述基于所述关联概率对所述待训练的词向量模型中的始词向量字典进行调整,得到目标词向量字典,包括:
根据各个所述候选词分别对应所述关联词的关联概率,构建第一损失函数;
通过所述第一损失函数对所述待训练的词向量模型进行训练,以调整所述初始词向量字典,直至达到第一训练停止条件时停止,得到训练好的词向量模型,以及所述训练好的词向量模型中的目标词向量字典。
3.根据权利要求1所述的方法,其特征在于,所述从各所述样本分词中选取输入词和相应的关联词,包括:
获取预设相邻参数,从各所述样本分词中选取输入词,并基于所述预设相邻参数确定各所述样本分词中与所述输入词相应的关联词;
所述将所述输入词输入待训练的词向量模型,基于所述待训练的词向量模型中的初始词向量字典,预测各个候选词对应所述关联词的关联概率,包括:
将所述输入词分别和每个关联词组合,获得样本词对;
将所述样本词对中的输入词输入待训练的词向量模型,基于所述待训练的词向量模型中的初始词向量字典,预测各个候选词对应所述样本词对中关联词的关联概率。
4.根据权利要求1所述的方法,其特征在于,所述对所述推广属性数据和所述用户相关数据分别进行编码处理,得到对应的推广属性特征和用户相关特征,包括:
当所述推广属性数据属于数值类型时,直接将所述推广属性数据作为对应的推广属性特征;
当所述推广属性数据属于非数值类型时,采用独热编码方式对所述推广属性数据进行编码处理,得到对应的推广属性特征;
对所述用户相关数据中的用户属性数据进行划分编号后,采用所述独热编码方式进行编码处理,得到对应的用户相关特征;所述用户属性数据至少包括用户性别、用户年龄和用户所属地域中的一种。
5.根据权利要求1所述的方法,其特征在于,所述基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,包括:
将所述词嵌入特征、所述推广属性特征和所述用户相关特征输入点击率预测模型,分别得到所述点击率预测模型中每个子预测模型输出的子点击率;
基于所述每个子预测模型分别输出的子点击率和对应的权重,确定所述用户对象针对所述推广信息的信息点击率。
6.根据权利要求1所述的方法,其特征在于,所述基于所述词嵌入特征、所述推广属性特征和所述用户相关特征,确定信息点击率,包括:
将各个词分别对应的词嵌入特征进行融合处理,得到所述推广描述内容对应的词嵌入表达;
通过点击率预测模型对所述词嵌入表达、所述推广属性特征和所述用户相关特征进行拼接处理,以输出信息点击率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110351765.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种半导体器件
- 下一篇:一种基于大数据的案件自动分类方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置