[发明专利]针对用户生成模型的方法、装置和计算机可读存储介质有效

专利信息
申请号: 202110522026.2 申请日: 2021-05-13
公开(公告)号: CN113112312B 公开(公告)日: 2022-09-30
发明(设计)人: 杨哲;杨一鹏 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06Q10/06;G06F21/62;G06N3/04;G06N3/08
代理公司: 上海专利商标事务所有限公司 31100 代理人: 钱孟清;段登新
地址: 310023 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 针对 用户 生成 模型 方法 装置 计算机 可读 存储 介质
【说明书】:

公开了一种用于针对用户生成模型的方法,包括:在服务器处获取多个用户的多个第一数据集;基于所述多个第一数据集,在所述服务器处利用元学习算法为所述多个用户生成共享模型;由所述服务器将所述共享模型传送至用户的客户端;在该用户的客户端处获取该用户的对应第二数据集;以及基于该用户的对应第二数据集,在该用户的客户端处对共享模型进行自适应训练以生成该用户的私有模型。本申请还涉及其它方法、装置和计算机可读存储设备。本申请的方法能够在保护隐私的情况下更准确地建立用户的私有模型。

技术领域

本说明书的一个或多个实施例涉及机器学习,尤其涉及用于针对用户生成模型的方法、装置和计算机可读存储介质。

背景技术

目前,随着大数据的使用,为了各种目的,例如对用户进行分类、聚类或者执行与用户有关的预测,通常需要对用户进行建模。

在传统方案中,通常对所有用户建立统一模型。而为了区分不同用户,现有的方法是基于特征层面的个性化,比如普遍使用的用户历史行为特征,而模型都是统一模型。也就是说,每个用户所使用的模型是一致的,不同用户通过其不同的特征(例如通过与用户相关联的数据集提取的特征)而体现其个性。然而,这种统一模型可能存在问题。

首先,为了利用尽量丰富的特征来训练统一模型,可能需要在服务器处收集许多用户的数据,甚至包括隐私数据,这可能对用户的隐私造成损害,且带来相关联的带宽和存储等成本。

其次,由于统一模型是利用来自多个用户的特征(数据集)训练的,而有些活跃用户的数据集比较大,数据样本多,使得训练好的统一模型更多地体现这些活跃用户的特征,对这些活跃用户的代表性较强;而另一些不活跃用户(或称长尾用户)或新用户的数据量则比较少,统一模型对这些用户的代表性较弱。因此,所生成的统一模型对于长尾用户和新用户的准确性可能不高。

因此,需要更准确、更能保护用户隐私的针对用户生成模型的方案。

发明内容

为了克服现有技术的缺陷,本说明书的一个或多个实施例通过为每个用户建立私有模型提供了更准确的建模方案,且对用户的隐私保护更加完善。

本说明书的一个或多个实施例通过以下技术方案来实现其上述目的。

在一个方面中,公开了一种用于针对用户生成模型的方法,包括:在服务器处获取多个用户的多个第一数据集;基于所述多个第一数据集,在所述服务器处利用元学习算法为所述多个用户生成共享模型;由所述服务器将所述共享模型传送至用户的客户端;在该用户的客户端处获取该用户的对应第二数据集;以及基于该用户的对应第二数据集,在该用户的客户端处对共享模型进行自适应训练以生成该用户的私有模型。

优选地,所述方法还包括:基于每一用户的对应第一数据集,使用所述共享模型生成该用户的云模型分;以及将该用户的云模型分传送至该用户的用户客户端,其中所述自适应训练进一步基于所述云模型分。

优选地,其中所述第一数据集不包括用户的敏感数据,所述第二数据集包括所述多个用户的敏感数据。

优选地,其中用户的对应第一数据集包括该用户的经模糊化的信息,且该用户的对应第二数据集包括该用户的未经模糊化的信息。

优选地,其中所述元学习算法包括步长超参α,其中每个用户的步长超参α至少部分基于该用户的数据量。

优选地,其中每个用户的步长超参α与该用户的数据量负相关。

优选地,其中所述元学习算法的损失函数为:

其中α为步长,Θ为共享模型的参数,而Θ’为每个用户的私有模型的参数,T为用户数。

优选地,其中基于每个用户的私有模型为用户生成推荐或对用户执行预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110522026.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top