[发明专利]隐私保护机器学习预测在审
申请号: | 202080026134.4 | 申请日: | 2020-10-14 |
公开(公告)号: | CN114761948A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | W.黄;J.P.加德纳;M.W.道布;A.E.马约罗夫 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06F17/10 | 分类号: | G06F17/10;G06F16/242;G06N5/00;G06N20/00;G06Q10/10 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 金玉洁 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 隐私 保护 机器 学习 预测 | ||
方法、系统和装置,包括编码在计算机存储介质上的计算机程序,用于向客户端设备提供数字组件。方法能够包括基于客户端设备上的当前用户活动周期,将临时组标识符分配给客户端设备,该标识符从多个不同组中标识包括客户端设备的特定组。生成用于训练生成用户特性的机器学习模型的训练集。从客户端设备接收对数字组件的请求,该请求包括当前分配给客户端设备的临时组标识符、活动特征的子集和基于客户端设备的一个或多个附加特征。机器学习模型生成一个或多个用户特性,基于其选择一个或多个数字组件并将其发送到客户端设备。
背景技术
本说明书涉及数据处理和机器学习模型。
客户端设备能够使用应用(例如,web浏览器、本机应用)来访问内容平台(例如,搜索平台、社交媒体平台或托管内容的另一平台)。内容平台能够在客户端设备上启动的应用内显示可以由一个或多个内容源/平台提供的数字组件(数字内容或数字信息的离散单元,诸如视频剪辑、音频剪辑、多媒体剪辑、图像、文本或另一内容单元)。
发明内容
通常,本说明书中描述的主题的一个创新方面能够体现在包括下述操作的方法中,包括:基于客户端设备上的当前用户活动周期,向客户端设备分配临时组标识符,该临时组标识符从多个不同组中标识包括客户端设备的特定组;为要训练的模型生成训练集,训练集包括(i)基于客户端设备处的当前用户活动周期分配给客户端设备的临时组标识符,(ii)已经被分配临时组标识符的用户的组特征集,以及(iii)由已经被分配临时组标识符的用户执行的用户活动的活动特征集,其中,临时组标识符从多个不同组中标识包括客户端设备的特定组;使用训练集训练模型;从给定客户端设备接收对数字组件的请求,请求至少包括:(i)当前分配给给定客户端设备的临时组标识符,(ii)活动特征集的子集,以及(iii)一个或多个附加特征,其中,一个或多个附加特征基于客户端设备;通过将经训练的模型应用于(i)临时组标识符和(ii)请求中包括的活动特征子集,生成没有在请求中包括的一个或多个用户特性;基于经训练的模型生成的一个或多个用户特性选择一个或多个数字组件;以及向客户端设备发送选择的一个或多个数字组件。
该方面的其他实现包括对应的装置、系统和计算机程序,被配置为执行在计算机存储设备上编码的方法的方面。这些和其他实现都能够选择性地包括以下特征的一个或多个。
在一些方面中,组特征集包括:(i)多个统一资源定位器(URL),包括由已经被分配临时组标识符的用户访问的多个URL,(ii)由已经被分配临时组标识符的用户访问的多个URL的表示。在一些方面中,组特征集还可以包括:(i)由已经被分配临时组标识符的用户访问的URL的计数和/或比例,(ii)由已经被分配临时组标识符的用户访问的URL处呈现的数字内容中的模式。
在一些方面中,组特征集包括一个或多个聚合用户组人口统计,共同表征与临时组标识符相对应的特定组中的用户,而不表征特定组中的任何单独用户。在一些方面中,组特征集包括聚合上下文预测,其中,聚合上下文预测是基于由已经被分配临时组标识符的用户访问的数字内容的预测输出。
在一些方面中,训练集的每个样本至少包括:(i)已经被分配临时组标识符的用户的匿名标识符,(ii)在用户被分配临时组标识符时用户访问的URL。
在一些方面中,活动特征集包括:(i)指定对数字组件的请求来源的地理标识符,(ii)提交对数字组件的请求来源的时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080026134.4/2.html,转载请声明来源钻瓜专利网。