[发明专利]相似人群的匹配方法、装置、电子设备及存储介质在审
申请号: | 202210551597.3 | 申请日: | 2022-05-18 |
公开(公告)号: | CN115146178A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 廖鹏;房栋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06K9/62;G06N20/00;A63F13/795 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;吴素花 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 相似 人群 匹配 方法 装置 电子设备 存储 介质 | ||
1.一种相似人群的匹配方法,其特征在于,所述方法包括:
获取待匹配的对照组和干预组;
调用机器学习模型预测所述对照组和所述干预组中每个对象被干预的概率;
对每个所述对象对应的所述概率进行均一化处理和取整处理,得到每个所述对象对应的趋势得分;
将所述对照组和所述干预组中趋势得分处于相同区间的对象划分到同一分桶中;
针对任一所述分桶,将从所述分桶中分别提取的属于所述对照组的对象、以及属于所述干预组的对象进行组合,得到匹配人群表。
2.根据权利要求1所述的方法,其特征在于,所述调用机器学习模型预测所述对照组和所述干预组中每个对象被干预的概率,包括:
针对所述对照组和所述干预组中的任一对象执行以下处理:
基于所述对象的特征调用机器学习模型进行预测处理,得到所述对象被干预的概率;
其中,所述机器学习模型是基于样本对象的特征、以及标注数据进行训练得到的,所述标注数据用于表征所述样本对象是否被干预。
3.根据权利要求1所述的方法,其特征在于,所述对每个所述对象对应的所述概率进行均一化处理和取整处理,得到每个所述对象对应的趋势得分,包括:
针对所述对照组和所述干预组中的任一对象执行以下处理:
将所述对象对应的所述概率与设定区间的最大值进行相乘处理;
将相乘结果进行向下取整处理,并将经过向下取整处理后得到的整数确定为所述对象对应的趋势得分。
4.根据权利要求1所述的方法,其特征在于,在将所述对照组和所述干预组中趋势得分处于相同区间的对象划分到同一分桶中之前,所述方法还包括:
创建多个分桶,其中,每个所述分桶对应的趋势得分的区间不同;
所述将所述对照组和所述干预组中趋势得分处于相同区间的对象划分到同一分桶中,包括:
针对所述对照组和所述干预组中的任一对象执行以下处理:
确定所述对象对应的所述趋势得分所处的区间;
将所述对象划分到所述多个分桶中与所述区间对应的目标分桶中。
5.根据权利要求1所述的方法,其特征在于,在将从所述分桶中分别提取的属于所述对照组的对象、以及属于所述干预组的对象进行组合之前,所述方法还包括:
确定所述分桶中属于所述对照组的对象的第一数量、以及属于所述干预组的对象的第二数量;
将所述第一数量和所述第二数量中的较小值,确定为所述分桶对应的阈值数量。
6.根据权利要求5所述的方法,其特征在于,所述确定所述分桶中属于所述对照组的对象的第一数量、以及属于所述干预组的对象的第二数量,包括:
以是否干预为主键,统计所述主键下对象标识的数量;
将未干预对应的对象标识的数量确定为所述分桶中属于所述对照组的对象的第一数量、以及将干预对应的对象标识的数量确定为所述分桶中属于所述干预组的对象的第二数量。
7.根据权利要求5所述的方法,其特征在于,所述将从所述分桶中分别提取的属于所述对照组的对象、以及属于所述干预组的对象进行组合,包括:
从所述分桶中提取属于所述对照组的所述阈值数量的对象、以及从所述分桶中提取属于所述干预组的所述阈值数量的对象;
将属于所述对照组的所述阈值数量的对象和属于所述干预组的所述阈值数量的对象进行组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210551597.3/1.html,转载请声明来源钻瓜专利网。