[发明专利]一种用户属性预测模型构建方法和装置有效
申请号: | 201710400378.4 | 申请日: | 2017-05-31 |
公开(公告)号: | CN107291840B | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 谢忠玉;鲍昕平;蔡龙军 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06Q10/04;G06Q50/00 |
代理公司: | 11319 北京润泽恒知识产权代理有限公司 | 代理人: | 莎日娜 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种用户属性预测模型构建方法和装置,所述方法包括:获取源样本集合原始特征和目标样本集合原始特征;生成源样本集合扩展特征;采用源样本集合原始特征及源样本集合扩展特征及所归属的用户属性构建第一用户属性预测模型和第二用户属性预测模型;统计第一用户属性预测模型和第二用户属性预测模型对目标样本集合原始特征的用户属性预测结果与实际用户属性的第一匹配度和第二匹配度;分别配置第一用户属性预测模型和第二用户属性预测模型的校正权重;根据第一用户属性预测模型及配置的校正权重及第二用户属性预测模型及配置的校正权重构建目标用户属性预测模型。根据本发明实现了跨领域的标注数据迁移,节省了人力物力。 | ||
搜索关键词: | 一种 用户 属性 预测 模型 构建 方法 装置 | ||
【主权项】:
1.一种用户属性预测模型构建方法,其特征在于,所述方法包括:/n分别从源样本集合和目标样本集合中,获取源样本集合原始特征和目标样本集合原始特征;其中,所述源样本集合为完成用户属性标注的文本数据样本的样本集合,所述目标样本集合为待标注用户属性的文本数据样本的样本集合;/n根据所述源样本集合原始特征和所述目标样本集合原始特征的对应关系,生成与所述源样本集合原始特征对应的源样本集合扩展特征;所述源样本集合原始特征和所述源样本集合扩展特征归属于相同的用户属性;/n采用所述源样本集合原始特征及所归属的用户属性,构建第一用户属性预测模型,以及,采用所述源样本集合扩展特征和所归属的用户属性,构建第二用户属性预测模型;/n统计所述第一用户属性预测模型对输入的目标样本集合原始特征的用户属性预测结果与实际用户属性的第一匹配度,以及,统计所述第二用户属性预测模型对输入的目标样本集合原始特征的用户属性预测结果与实际用户属性的第二匹配度;/n采用所述第一匹配度和所述第二匹配度,分别配置所述第一用户属性预测模型和所述第二用户属性预测模型的校正权重;/n根据所述第一用户属性预测模型及配置的校正权重,及所述第二用户属性预测模型及配置的校正权重,构建目标用户属性预测模型。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710400378.4/,转载请声明来源钻瓜专利网。