[发明专利]一种社交媒体用户行为时间模式的自适应隐私保护方法有效
申请号: | 201710706006.4 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107688751B | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 曾剑平;张泽文 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 社交 媒体 用户 行为 时间 模式 自适应 隐私 保护 方法 | ||
本发明属于互联网社交媒体技术领域,具体为社交媒体用户行为时间模式的自适应隐私保护方法。本发明方法包含自适应时间粒度选择方法和自适应微聚集隐私保护算法Ada‑MAPP。在用户行为时间模式的处理上,根据社交媒体的活跃度不同,自适应地选择合适的时间粒度;以社交媒体用户行为的时间模式和匿名度参数作为输入,通过Ada‑MAPP,根据信息损失的比较,决定候选点是否加入既有类中。Ada‑MAPP对用户行为模式数据进行由外向内的聚类,最后用质心替代原始数据实现匿名保护,得到隐私保护数据。本发明能够适应于不同活跃度的社交媒体;在保证匿名度的前提下,减少隐私保护所产生的信息损失,提升隐私数据的可用性。
技术领域
本发明属于互联网社交媒体技术领域,具体涉及社交媒体用户行为时间模式的自适应隐私保护方法。
背景技术
伴随着微博、网络论坛等传统的社交媒体以及微信、Facebook、Twitter等新兴社交媒体的出现,人们进入了社交媒体时代。社交媒体的快速兴起加速了信息的流动,使得人与人之间的沟通变得越来越便捷。冯登国等人指出,随着非结构化数据、社交网络数据的激增,以及云计算、移动计算的快速发展,当前数据处理量动辄几PB,而全球数据量也已增长到ZB级[1]。大数据技术的发轫正是源于用户对海量数据的采集、存储、管理、分析以及持久性的需求,因此这是顺应用户需求的产物。
庞大的数据量也导致了大数据安全问题,需要通过隐私保护技术来解决。究其原因,随着网络技术的快速发展和用户在网络中的参与度的极大提高,对于每一个个体,都存在着与之相关的网络信息,这些相关信息的存量不断累积,攻击者就可以通过相关信息的不同组合来挖掘隐私,导致隐私泄露。例如,用户在网络社交媒体上的发贴、回帖等行为都会留下时间戳信息,由此构成的时间模式在很大程度上反映了个人的行为特点,因此容易导致个人隐私泄露。
随着互联网安全与隐私的关注度越来越高,国内外关于隐私保护技术的研究也越来越多。隐私保护技术的主要研究方向包括通用的隐私保护技术、面向数据挖掘的隐私保护技术、基于隐私保护的数据发布、隐私保护算法等[2]。通用的隐私保护技术致力于在较低应用层次上保护数据的隐私,一般通过引入统计模型和概率模型来实现;面向数据挖掘的隐私保护技术主要解决在高层数据应用中,如何根据不同数据挖掘操作的特性,实现对隐私保护;基于隐私保护的数据发布是为了提供一种在各类应用中可以通用的隐私保护方法,进而使得在此基础上设计的隐私保护算法也具有通用性。作为新兴的研究热点,隐私保护技术不论在理论研究还是实际应用方面,都具有非常重要的价值。
传统隐私保护算法的保护对象主要是用户的身份信息、地理位置信息、疾患信息、社会联系信息等,但是,对于社交媒体中的用户行为时间模式的隐私保护的研究还比较少。用户行为时间模式这种新的数据类型在当今网络飞速发展的时代显得越来越突出。首先,当前社会中的各项工作都越来越趋向于无纸化,各类信息通过电子系统、社交媒体等方式记录到存储介质中,而这种记录的行为是由特定的个体来执行的,特定的个体具备特定的时间模式;其次,特定个体参与的各种电子系统、社交媒体的种类越来越多,会在这些平台上留痕,而其中的时间模式是可以公开获取的,这种时间模式可能成为连接各平台、侵害特定个体隐私的准标识符。
虽然以往的算法,如MDAV算法、V-MDAV算法、IV-MDAV算法[3,4],在某种程度上可以处理这种时间模式数据,但是直接使用这些算法来进行时间行为模式的隐私保护,会造成较大的信息损失,降低数据可用性。在MDAV之类的微聚集算法中,当找到整个元信息集的质心后,需要寻找距离质心最远的第一候选点,和距离第一候选点最远的第二候选点,然后同时考虑第一、第二候选点的聚类问题。这种设计虽然在某种程度上加快了算法的执行效率,但这却是以牺牲算法的整体性为代价的。主要原因是,若同时考虑两个候选点的聚类问题,就无法准确找出单个聚类的信息损失与元信息集整体信息损失之间的关系,同时,也无法判断这两个聚类相互影响的程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710706006.4/2.html,转载请声明来源钻瓜专利网。