[发明专利]实现定制隐私保护的个性化信息检索系统的方法有效
申请号: | 201110092557.9 | 申请日: | 2011-04-13 |
公开(公告)号: | CN102163230A | 公开(公告)日: | 2011-08-24 |
发明(设计)人: | 陈珂;寿黎但;陈刚;胡天磊;柏壑 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林怀禹 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实现 定制 隐私 保护 个性化 信息 检索系统 方法 | ||
技术领域
本发明涉及个性化信息检索系统、敏感数据隐藏与隐私保护方法,特别是涉及一种实现定制隐私保护的个性化信息检索系统的方法。
背景技术
信息检索技术和隐私保护技术是计算机领域中研究最为长远、应用最为广泛的两个技术。一直以来,这两项技术在发展过程中彼此基本相互独立。信息检索技术及以此为基础的个性化信息检索,用于各类海量数据的维护与查询,主要研究数据特征提取、索引维护、查询结果排序与评价方法。隐私保护技术主要应用于数据采集与发布领域,研究开放环境下对个体敏感数据的隐藏模型和代价评估方法。
随着互联网技术的发展和Web资源的日渐丰富,特别是强调“以人为本”的Web2.0网络概念的兴起,越来越多的互联网信息检索应用通过分析用户行为、学习用户偏好以优化检索机制,提供个性化信息检索服务。然而,由于在此过程中,系统需要搜集和分析大量的用户个人信息,任何对此类信息的不当使用和发布都会导致严重的隐私泄露。该问题已经成为个性化信息检索系统被广泛应用的最大障碍。因此,业界迫切需要一个完善的信息检索解决方案,在提供高效、符合用户需要的检索结果的同时,保障用户的个人信息不被侵犯和滥用。但由于信息检索系统中隐私保护相关研究刚刚起步,目前尚未产生一个成熟完备的支持隐私保护的个性化信息检索方案。
目前如Google、Yahoo等成熟的信息检索服务供应商对于其个性化产品的隐私保护,主要采用安全访问协议,保护数据不被攻击者截获。但这种方法只能保护数据传输信道的安全,不能防止服务器终端对用户隐私的侵犯。而在研究领域,目前成果主要采用在发送用户请求前,在客户端对于用户信息进行泛化处理,来限制服务提供商对于用户准确信息的掌握,同时保证服务质量。一方面这一方法没有充分利用不同用户对于隐私保护的特殊需求,隐私保护方法不能与用户隐私需求相匹配;另一方面该方法缺乏对不同检索请求特性的分析,难以在检索质量和隐私保护之间进行有效的权衡。
由于信息检索系统与隐私保护系统在各自的领域都已经经历长久的发展,积累了众多成熟的技术。因此要实现支持隐私保护的个性化信息检索系统,应该在当前成熟的个性化信息检索解决方案中,最大限度地引入在数据采集与发布领域中丰富的隐私保护技术。此外,系统应根据用户的隐私需求和检索请求的特性,支持隐私保护方法的可定制,在检索质量和隐私保护之间进行有效的权衡。
发明内容
为了克服背景技术中现有方法没有充分利用不同用户对于隐私保护的特殊需求,隐私保护方法不能与用户隐私需求相匹配;而且缺乏对不同检索请求特性的分析,造成难以在检索质量和隐私保护之间进行有效的权衡问题。本发明的目的在于提供一种实现定制隐私保护的个性化信息检索系统的方法。
本发明解决其技术问题采用的技术方案是,该方法的步骤如下:
步骤1)设计定制隐私保护的个性化信息检索系统的系统架构,并根据该系统架构选择相应的隐私保护模型;
步骤2)实现步骤1)中隐私保护模型所需的多级语义粒度的用户模型,用于描述用户偏好,并在用户模型基础上定制用户隐私,分析攻击者模型和定义隐私保护目标;
步骤3)开发支持隐私保护的个性化信息检索系统的通用框架,根据用户的隐私需求,使用数据泛化技术对用户模型进行定制泛化;
步骤4)基于用户模型开发分别用于预测量化当前用户模型用于个性化检索的查询质量指标和隐私风险指标,将该两个指标融合为综合性能指标;同时开发用于预测量化特定检索歧义程度的指标,以实现用户模型泛化的自适应调节;
步骤5)开发用户模型泛化方法,针对特定信息检索请求的特性,依据步骤4)开发的三个指标,生成泛化用户模型,并使用该泛化用户模型进行个性化信息检索。
所述步骤1)中设计的系统架构,用于分析该系统所使用的应用场景;在该应用场景中,用户不信任除自己之外的任何实体,因此隐私保护机制需要作为一个信息检索代理在客户端引入;该代理对用户模型在本地进行语义泛化后,才将其分享给服务器用于个性化信息检索;因此,该系统架构的设计方法如下:
a)每当用户提交一个信息检索请求,代理根据用户定制的隐私需求和该检索请求的内容特性,将完整的用户模型泛化成相应的实例;
b)检索代理将用户提交的信息检索请求和相应的用户模型泛化实例,一并发送给服务器,用于个性化信息检索;
c)服务器根据查询代理分享的用户模型泛化实例,对信息检索请求的结果进行个性化重排,并将结果发送回查询代理;
d)查询代理对于取得的查询结果,使用本地完整的用户模型进一步优化,并将查询结果呈现给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110092557.9/2.html,转载请声明来源钻瓜专利网。