[发明专利]基于注意力机制的跨社交媒体用户身份识别方法及系统有效

申请号：	201910431115.9	申请日：	2019-05-22
公开（公告）号：	CN110210540B	公开（公告）日：	2021-02-26
发明（设计）人：	崔思伟;宋雪萌;陈潇琳;尹建华;刘萌;甘甜	申请（专利权）人：	山东大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06Q50/00;G06N3/04;G06N3/08
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	黄海丽
地址：	250101 山东***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于注意力机制社交媒体用户身份识别方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于注意力机制的跨社交媒体用户身份识别方法及方法，所述方法包括以下步骤：获取不同社交媒体上多个用户的不同模态的数据作为训练数据；对于不同模态的数据，分别采用不同的模型学习数据的潜在表示，训练用户身份识别模型：结合时序关系和不同模态数据的置信度，计算不同社交媒体上用户之间数据的相似度；使用多层感知机将用户之间相似度映射到概率空间，得到不同社交媒体上用户指向同一用户实体的概率；采用交叉熵构建目标函数，对模型参数进行迭代优化求解；所述模型用于针对不同社交媒体上的不同模态数据确定是否指向同一用户。本发明考虑了不同模态数据传递数据的差异，用户身份识别的准确性更高。

技术领域

本发明涉及用户身份识别技术领域，尤其涉及一种基于注意力机制的跨社交媒体用户身份识别方法及系统。

背景技术

在当今这个跨社交媒体日趋成熟，用户生成数据逐渐呈现多源化的时代，用户的多源异构数据往往能从不同的角度折射他们的日常生活，从不同的方面反映他们的属性特征。有机整合用户分散在多个社会媒体上的行为数据，为深度理解用户行为、剖析用户特征，全面地对用户建模带来了可能。本质上，跨社交媒体的用户身份识别是后续整合用户的前提，因此引起许多研究者的注意。然而现有的技术主要依赖于用户配置信息(用户名、生日、性别)和社交网络结构，忽略了更为丰富的用户生成数据，使得模型的可解释性较差。

发明内容

为克服上述现有技术的不足，本发明提供了一种基于注意力机制的跨社交媒体用户身份识别方法及系统，考虑了不同模态数据传递信息的差异，用户身份识别的准确性更高。

为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：

一种基于注意力机制的跨社交媒体用户身份识别方法，包括以下步骤：

获取不同社交媒体上多个用户的不同模态的数据作为训练数据；

对于不同模态的数据，分别采用不同的模型学习数据的潜在表示，训练用户身份识别模型：

结合时序关系和不同模态数据的置信度，计算不同社交媒体上用户之间数据的相似度；

使用多层感知机将用户之间相似度映射到概率空间，得到不同社交媒体上用户指向同一用户实体的概率；

采用交叉熵构建目标函数，对模型参数进行迭代优化求解；

所述模型用于针对不同社交媒体上的不同模态数据确定是否指向同一用户。

一个或多个实施例提供了一种基于注意力机制的跨社交媒体用户身份识别系统，包括：

数据获取模块，抓取不同社交媒体上用户的不同模态的数据；