[发明专利]针对用户生成模型的方法、装置和计算机可读存储介质有效
申请号: | 202110522026.2 | 申请日: | 2021-05-13 |
公开(公告)号: | CN113112312B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 杨哲;杨一鹏 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/06;G06F21/62;G06N3/04;G06N3/08 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 钱孟清;段登新 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 用户 生成 模型 方法 装置 计算机 可读 存储 介质 | ||
公开了一种用于针对用户生成模型的方法,包括:在服务器处获取多个用户的多个第一数据集;基于所述多个第一数据集,在所述服务器处利用元学习算法为所述多个用户生成共享模型;由所述服务器将所述共享模型传送至用户的客户端;在该用户的客户端处获取该用户的对应第二数据集;以及基于该用户的对应第二数据集,在该用户的客户端处对共享模型进行自适应训练以生成该用户的私有模型。本申请还涉及其它方法、装置和计算机可读存储设备。本申请的方法能够在保护隐私的情况下更准确地建立用户的私有模型。
技术领域
本说明书的一个或多个实施例涉及机器学习,尤其涉及用于针对用户生成模型的方法、装置和计算机可读存储介质。
背景技术
目前,随着大数据的使用,为了各种目的,例如对用户进行分类、聚类或者执行与用户有关的预测,通常需要对用户进行建模。
在传统方案中,通常对所有用户建立统一模型。而为了区分不同用户,现有的方法是基于特征层面的个性化,比如普遍使用的用户历史行为特征,而模型都是统一模型。也就是说,每个用户所使用的模型是一致的,不同用户通过其不同的特征(例如通过与用户相关联的数据集提取的特征)而体现其个性。然而,这种统一模型可能存在问题。
首先,为了利用尽量丰富的特征来训练统一模型,可能需要在服务器处收集许多用户的数据,甚至包括隐私数据,这可能对用户的隐私造成损害,且带来相关联的带宽和存储等成本。
其次,由于统一模型是利用来自多个用户的特征(数据集)训练的,而有些活跃用户的数据集比较大,数据样本多,使得训练好的统一模型更多地体现这些活跃用户的特征,对这些活跃用户的代表性较强;而另一些不活跃用户(或称长尾用户)或新用户的数据量则比较少,统一模型对这些用户的代表性较弱。因此,所生成的统一模型对于长尾用户和新用户的准确性可能不高。
因此,需要更准确、更能保护用户隐私的针对用户生成模型的方案。
发明内容
为了克服现有技术的缺陷,本说明书的一个或多个实施例通过为每个用户建立私有模型提供了更准确的建模方案,且对用户的隐私保护更加完善。
本说明书的一个或多个实施例通过以下技术方案来实现其上述目的。
在一个方面中,公开了一种用于针对用户生成模型的方法,包括:在服务器处获取多个用户的多个第一数据集;基于所述多个第一数据集,在所述服务器处利用元学习算法为所述多个用户生成共享模型;由所述服务器将所述共享模型传送至用户的客户端;在该用户的客户端处获取该用户的对应第二数据集;以及基于该用户的对应第二数据集,在该用户的客户端处对共享模型进行自适应训练以生成该用户的私有模型。
优选地,所述方法还包括:基于每一用户的对应第一数据集,使用所述共享模型生成该用户的云模型分;以及将该用户的云模型分传送至该用户的用户客户端,其中所述自适应训练进一步基于所述云模型分。
优选地,其中所述第一数据集不包括用户的敏感数据,所述第二数据集包括所述多个用户的敏感数据。
优选地,其中用户的对应第一数据集包括该用户的经模糊化的信息,且该用户的对应第二数据集包括该用户的未经模糊化的信息。
优选地,其中所述元学习算法包括步长超参α,其中每个用户的步长超参α至少部分基于该用户的数据量。
优选地,其中每个用户的步长超参α与该用户的数据量负相关。
优选地,其中所述元学习算法的损失函数为:
其中α为步长,Θ为共享模型的参数,而Θ’为每个用户的私有模型的参数,T为用户数。
优选地,其中基于每个用户的私有模型为用户生成推荐或对用户执行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110522026.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机械动力式的有机废弃物再生系统
- 下一篇:一种直流升压电路