[发明专利]检测社交媒体用户隐私泄露的方法和系统有效
申请号: | 201910387263.5 | 申请日: | 2019-05-10 |
公开(公告)号: | CN110210244B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 梁英;董祥祥;李锦涛;谢小杰;史红周;高昂 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检测 社交 媒体 用户 隐私 泄露 方法 系统 | ||
本发明的实施例提供了检测社交媒体用户隐私泄露的方法和系统,其中基于用户发布的数据评估用户每个隐私属性的确定性,基于用户所在社交媒体的网络结构确定用户数据的可见性,以及根据用户隐私属性的确定性和用户数据的可见性来衡量该用户隐私泄露的程度,并向该用户发出隐私泄露风险提示。本发明实施例的技术方案中基于用户发布的信息内容、社交网络结构、用户社交关系强度、用户隐私偏好设置等因素全面有效量化了用户隐私泄露程度,能帮助社交媒体用户及时发现隐私泄露事件的发生,从而减小了隐私泄露的危害。
技术领域
本发明涉及社交媒体数据挖掘及隐私保护技术,尤其涉及用于检测社交媒体用户隐私是否泄露的方法和系统。
背景技术
社交媒体(Social Media)指互联网上基于用户关系的内容生产与交换平台。当前,社交媒体已经被广泛应用于人们的日常生活中,是人们彼此之间用来分享意见、见解和观点的工具和平台。社交媒体为人们在线社交提供便利的同时也带来了隐私泄露的风险。人们通常会主动通过社交媒体发布信息,而这些信息很有可能涉及用户隐私,比如用户的性别,工作和地址等。在社交网络中,用户发布的信息可以被他人轻易获取,很可能造成隐私泄露;而用户又难以确切地了解或控制这些消息的具体去向,所以也很难及时察觉其隐私已经被泄露。由此,亟需一种能够帮助社交媒体用户及时发现隐私泄露事件的方法,以尽量减小隐私泄露的危害,这对维护社交网络安全有积极意义。
发明内容
本发明实施例的目的在于提供一种检测社交媒体用户隐私泄露的方法和系统,对用户隐私泄露风险进行有效评估,帮助用户及时发现可能的隐私泄露事件。
上述目的是通过以下技术方案实现的:
根据本发明实施例的第一方面,提供了一种检测社交媒体用户隐私泄露的方法,包括:
基于用户发布的数据评估用户每个隐私属性的确定性,所述隐私属性的确定性用于指示根据用户发布的数据能推测出用户隐私属性的取值的可能性大小;基于用户所在社交媒体的网络结构确定用户数据的可见性,所述用户数据的可见性用于指示用户发布的数据能被社交媒体中其他用户获取的可能性大小;根据用户隐私属性的确定性和用户数据的可见性来衡量该用户隐私泄露的程度;以及响应于用户隐私泄露的程度大于设定的阈值,向该用户发出隐私泄露风险提示信息。
在一些实施例中,该方法还可包括获取用户对于各隐私属性的偏好设置,并根据用户设置的隐私属性偏好确定用户对于每个隐私属性的敏感程度;以及根据所述用户隐私属性的确定性、用户数据的可见性以及用户对于每个隐私属性的敏感程度来共同衡量所述用户隐私泄露的程度。
在一些实施例中,基于用户发布的数据评估用户隐私属性的确定性可以是利用与各隐私属性对应的预先训练好的属性识别模型来完成的,每个隐私属性对应的属性识别模型输入为用户发布的数据,其输出为该用户的隐私属性分别取各个属性值的概率。
在一些实施例中,每个隐私属性对应的属性识别模型可以是通过下列步骤进行训练的:采集一段时间内社交媒体中各用户发布的信息,对于所采集的数据集中每条信息标定发布该信息的用户对于该隐私属性的属性取值;将标定后的数据集作为样本集来训练该隐私属性对应的属性识别模型。
在一些实施例中,用户隐私属性的确定性可使用如下公式进行计算:
其中,cerjm代表对于社交媒体中用户j的第m个隐私属性的确定性,prajmk表示用户j的第m个隐私属性取第k个属性值的概率,Km表示第m个隐私属性的可能取的属性值的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910387263.5/2.html,转载请声明来源钻瓜专利网。