[发明专利]基于学习的组标记系统和方法有效
申请号: | 201780051176.1 | 申请日: | 2017-04-20 |
公开(公告)号: | CN109690571B | 公开(公告)日: | 2020-09-18 |
发明(设计)人: | 杨文君;李奘;凌宏博;曹利锋;常智华;杨帆 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 提供了用于组标记的系统和方法。该系统可以包括可访问平台数据的处理器,该平台数据包括多个用户以及多个相关数据域,该系统还包括存储指令的存储器,所述指令在由处理器执行时使该系统执行方法。该方法可以包括获取用户的第一子集以及相关第一标签;为所述相关数据域分别确定所述用户的第一子集与多个用户中至少一些用户之间的至少一个差值;响应于确定所述差值超过第一阈值,确定对应数据域作为关键数据域;确定对应关键数据域的数据作为正样本,所述关键数据域与所述用户的第一子集相关;基于关键数据域,获取用户的第二子集以及相关数据作为负样本;以及用正样本和负样本训练规则模型。 | ||
搜索关键词: | 基于 学习 标记 系统 方法 | ||
【主权项】:
1.一种用于组标记的计算系统,包括:可访问平台数据的一个或多个处理器,其中所述平台数据包括多个用户以及多个相关数据域;以及存储指令的存储器,当所述指令由一个或多个处理器执行时,使所述计算系统执行:获取用户的第一子集以及与所述用户的第一子集相关的一个或多个第一标签;分别为所述关联数据域中一个或多个,确定所述用户的第一子集与至少部分所述多个用户之间的至少一个差值;响应于确定所述差值超过第一阈值,确定对应数据域作为关键数据域;确定对应的一个或多个关键数据域的数据作为正样本,所述一个或多个关键数据域与所述用户的第一子集相关;基于所述一个或多个关键数据域,获取来自所述平台数据的用户的第二子集以及相关数据作为负样本;以及用所述正样本和所述负样本训练规则模型以获取训练后的组标记规则模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780051176.1/,转载请声明来源钻瓜专利网。