[发明专利]一种用户身份关联方法及装置有效

专利信息
申请号: 201910155928.X 申请日: 2019-03-01
公开(公告)号: CN110046293B 公开(公告)日: 2021-04-23
发明(设计)人: 薛一波;项芳琪 申请(专利权)人: 清华大学
主分类号: G06F16/951 分类号: G06F16/951
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 王庆龙;苗晓静
地址: 100084 北京市海*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用户 身份 关联 方法 装置
【说明书】:

发明实施例提供一种用户身份关联方法及装置,该方法包括:根据第一预设数量的第一平台的种子ID,使用多个APP身份轮询第一平台的API,获取第二预设数量的用户ID和轮询记录;启动第二平台爬虫操作,扫描轮询记录获取对应的URL,得到轮询记录中URL指向第二平台的关联ID和不指向第二平台的非关联ID;提取关联ID和非关联ID的特征,得到第一特征向量用于训练二分类模型;获取第一平台用户ID和第二平台用户ID,特征提取后得到特征向量并输入到二分类模型中,得到身份关联结果。本发明实施例提供的用户身份关联方法及装置,从用户个人资料中提取有效特征,实现了多源社会网络中的用户身份关联,在保证较高准确率的情况下节省计算资源。

技术领域

本发明涉及数据获取与社会网络技术领域,尤其涉及一种用户身份关联方法及装置。

背景技术

互联网技术日新月异,它所引起的重大变革,赋予了生产生活崭新且有意义的定义,同时又正向促进越来越多的人投身于互联网建设。社会网络作为互联网最具影响力的产物之一,更是逐渐成为人们学习工作、生活娱乐不可缺少的工具。不同社会网络的功能不尽相同:有的专注于社交圈建设,有的收集评论并按某种机制进行影视推荐,有的面向生活轨迹的分享。为了更好地享受各大社交网络所带来的服务,人们倾向于同时加入多个社会网络。一个人同时使用多个社会网络,已经成为普遍趋势;而成百上千亿个账号在社会网络中产生的数据无疑是爆炸式增长的,这既为用户推荐带来了无限商机,又给信息传播的管理带来了极大挑战。

单个社会网络的用户信息通常是片面的,因此针对用户的研究容易变得狭隘,结合多个社会网络的数据是弥补缺陷的有效方式之一。多源社会网络的用户身份关联,正是基于各大社会网站信息互补的想法,通过匹配同一用户在不同社会网络的账号,为后续挖掘用户兴趣、探究信息经由关键用户在不同社会网络上的传播模式等提供有效的技术手段。

多源社会网络的用户身份关联对一些现有的社会网络任务,比如用户推荐、信息传播、广告投放等,具有重要的意义。考虑这样一种场景,一个视频网站想给用户推荐视频,并希望推荐针对每名用户都是足够准确的,但是冷启动和数据稀疏问题是常态,这显然会让个性化推荐变得异常困难。一个有效的解决方案是借助用户在其他社会网络上的原创内容进行建模,由此视频网站能够进行精准的推荐。但事实上由于社会网络之间数据不共享、用户匿名等情况,要获取一名视频网站用户在其他平台的原创内容,必须首先关联他的两个平台账号,即用户身份关联。由此可见,多源社会网络的用户身份关联将会给现有任务带来不同的问题视角和解决手段。

然而,在多源社会网络的用户身份关联领域中,用户的真实数据获取是第一个难点,而现有的多源社会网络的用户身份关联方法往往采用较为丰富的用户数据,对数据收集和处理很不友好,因而难以投入实际使用。

发明内容

本发明实施例为克服上述技术缺陷,提供一种用户身份关联方法及装置。

第一方面,本发明实施例提供一种用户身份关联方法,包括:

根据第一预设数量的第一平台的种子ID,使用多个APP身份轮询第一平台的API,获取第二预设数量的用户ID和轮询记录;

根据所述第一平台的种子ID和所述第二预设数量的用户ID启动第二平台爬虫操作,扫描所述轮询记录,根据所述轮询记录获取对应的URL,得到所述轮询记录中URL指向第二平台的关联ID和不指向第二平台的非关联ID;

提取所述关联ID和所述非关联ID的特征,得到第一特征向量,根据所述第一特征向量训练二分类模型;

获取第一平台用户ID和第二平台用户ID,对所述第一平台用户ID和所述第二平台用户ID进行特征提取,得到特征向量并输入到所述二分类模型中,得到身份关联结果。

第二方面,本发明实施例提供一种用户身份关联装置,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910155928.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top