[发明专利]确定标签的方法、装置、电子设备及可读存储介质在审
申请号: | 201910168755.5 | 申请日: | 2019-03-06 |
公开(公告)号: | CN110046928A | 公开(公告)日: | 2019-07-23 |
发明(设计)人: | 王月颖;陈沙沙 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/06 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预估 行为产生 标签 可读存储介质 概率 电子设备 概率样本 校准 历史行为数据 实际行为 输入校准 校准模型 映射关系 准确度 预设 申请 | ||
本申请实施例提供了一种确定标签的方法、装置、电子设备及可读存储介质,以提高确定标签的准确度。所述方法包括:根据用户的历史行为数据,确定所述用户的预估行为产生概率;将所述用户的预估行为产生概率输入校准模型,以对所述用户的预估行为产生概率进行校准,其中,所述校准模型是以多组预估行为产生概率样本值和实际行为产生概率样本值之间的映射关系为输入,对第一预设模型进行训练所得到的模型;根据所述用户的校准后的预估行为产生概率,确定所述用户的标签。
技术领域
本申请实施例涉及数据处理技术领域,尤其涉及一种确定标签的方法、装置、电子设备及可读存储介质。
背景技术
准确地确定用户的标签对信息推送具有重大意义,根据用户的标签,可以精准地向用户推送合适的信息。
相关技术提供了一种基于用户画像确定用户标签的方法。采用该方法,首先,确定用户的用户画像,确定一个用户的用户画像而使用的信息包括该用户的基本信息,例如:性别、年龄、星座、常驻地等,也包括该用户的行为频次,例如:信息点击频次,信息浏览频次等等。然后,根据一个用户的用户画像确定该用户的标签。
然而,上述确定用户的标签的方法仅仅依赖于用户画像,而确定用户的用户画像的信息不一定真实,导致用户画像的准确度不够高,进而直接影响到用户标签的准确度。因而,相关技术中的确定用户标签的方法的准确度有待提高。
发明内容
本申请实施例提供一种确定标签的方法、装置、电子设备及可读存储介质,以提高确定用户的标签的准确度。
本申请实施例第一方面提供了一种确定用户的标签的方法,所述方法包括:
根据用户的历史行为数据,确定所述用户的预估行为产生概率;
将所述用户的预估行为产生概率输入校准模型,以对所述用户的预估行为产生概率进行校准,其中,所述校准模型是以多组预估行为产生概率样本值和实际行为产生概率样本值之间的映射关系为输入,对第一预设模型进行训练所得到的模型;
根据所述校准后的预估行为产生概率,确定所述用户的标签。可选地,所述方法还包括:
获得信息发布方设置的目标参数;
采集所述用户的与所述目标参数关联的历史行为数据。
可选地,在确定所述用户的标签之后,所述方法还包括:
根据所述目标参数,确定目标受众;
向所述目标受众推送所述信息发布方发布的信息。
可选地,所述校准模型是按以下步骤得到的:
按照所述多个样本数据各自的预估行为产生概率的大小,对所述多个样本数据进行排序;
将排序后的多个样本数据分划分为多组样本数据;
针对所述多组样本数据中的每组样本数据,对该组样本数据的预估行为产生概率进行平均,得到该组预估行为产生概率样本值;
根据该组样本数据中每个样本数据携带的标记是否是预设标记,确定该组样本数据中携带的标记是预设标记的样本数据的占比,并将所述占比确定为该组实际行为产生概率样本值;
根据多组预估行为产生概率样本值和实际行为产生概率样本值之间的映射关系为输入,对第一预设模型进行训练,得到所述校准模型。
可选地,根据用户的历史行为数据,确定所述用户的预估行为产生概率,包括:
获得所述用户的站内历史行为数据和站外历史行为数据;
将所述用户的站内历史行为数据和站外历史行为数据输入行为产生概率预估模型,确定所述用户的预估行为产生概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910168755.5/2.html,转载请声明来源钻瓜专利网。