[发明专利]检测社交媒体用户隐私泄露的方法和系统有效
申请号: | 201910387263.5 | 申请日: | 2019-05-10 |
公开(公告)号: | CN110210244B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 梁英;董祥祥;李锦涛;谢小杰;史红周;高昂 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 社交 媒体 用户 隐私 泄露 方法 系统 | ||
1.一种检测社交媒体用户隐私泄露的方法,包括:
基于用户发布的数据评估用户每个隐私属性的确定性,所述隐私属性的确定性用于指示根据用户发布的数据能推测出用户隐私属性的取值的可能性大小;
基于用户所在社交媒体的网络结构确定用户数据的可见性,所述用户数据的可见性用于指示用户发布的数据能被社交媒体中其他用户获取的可能性大小;
根据用户隐私属性的确定性和用户数据的可见性来衡量该用户隐私泄露的程度;
响应于用户隐私泄露的程度大于设定的阈值,向该用户发出隐私泄露风险提示信息;
其中基于用户发布的数据评估用户隐私属性的确定性是利用与各隐私属性对应的预先训练好的属性识别模型来完成的,每个隐私属性对应的属性识别模型输入为用户发布的数据,其输出为该用户的隐私属性分别取各个属性值的概率。
2.根据权利要求1所述的方法,还包括获取用户对于各隐私属性的偏好设置,并根据用户设置的隐私属性偏好确定用户对于每个隐私属性的敏感程度;以及
根据所述用户隐私属性的确定性、用户数据的可见性以及用户对于每个隐私属性的敏感程度来共同衡量所述用户隐私泄露的程度。
3.根据权利要求1所述的方法,其中每个隐私属性对应的属性识别模型是通过下列步骤进行训练的:
采集一段时间内社交媒体中各用户发布的信息,对于所采集的数据集中每条信息标定发布该信息的用户对于该隐私属性的属性取值;
将标定后的数据集作为样本集来训练该隐私属性对应的属性识别模型。
4.根据权利要求1所述的方法,其中用户隐私属性的确定性以如下公式进行计算:
其中,cerjm代表对于社交媒体中用户j的第m个隐私属性的确定性,prajmk表示用户j的第m个隐私属性取第k个属性值的概率,Km表示第m个隐私属性的可能取的属性值的数量。
5.根据权利要求1-2或3-4中任一项所述的方法,其中用户数据的可见性以基于下列中的一项或多项来衡量:用户在社交网络中的重要程度、用户之间的社交关系强度和用户的活跃程度;其中用户在社交媒体中的重要程度是根据社交媒体的当前网络结构统计的关注该用户的用户数量以及关注该用户的各用户本身的重要程度来计算的;用户之间的社交关系强度根据用户之间的关注关系和/或用户之间的交互频率来设置;用户的活跃程度以用户在一段时间内发布的信息数量来衡量。
6.根据权利要求5所述的方法,其中用户在社交网络中的重要程度是通过下列步骤获取的:
步骤A1:将社交媒体的各用户的重要程度以用户重要性向量UR来表示,该向量为n维,其中n指示社交媒体的用户数量,该向量的第i个元素uri表示用户i在社交网络中的重要程度,该向量的每个元素取值都初始化为1/n;
步骤A2:基于社交网络中各用户之间的社交关系,按照下面的更新公式对用户重要性向量进行更新:
其中,URt表示更新t轮后的用户重要性向量;q是阻尼系数,其取值为0-1之间的实数;T为指示社交网络中各用户间社交关系的矩阵,该矩阵T中第i行j列的元素tij表示用户i对用户j的关注程度,tij=0表示用户i未关注用户j,tij0表示用户i关注了用户j。
7.根据权利要求6所述的方法,其中用户数据的可见性以如下公式计算:
或者
其中,visj表示用户j的数据可见性,tij表示用户i对用户j的关注程度,tij=0表示用户i未关注用户j,tij0表示用户i关注了用户j;I(x)代表一个指示函数,其输入变量x为真返回1,否则返回0;urj表示用户j在社交媒体的网络中的重要程度;wbj表示用户j在一段时间内发布的信息数量,h为取值为0-1之间的参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910387263.5/1.html,转载请声明来源钻瓜专利网。