[发明专利]对文档集合进行主题级别隐私保护的方法和系统无效
申请号: | 201010132593.9 | 申请日: | 2010-03-24 |
公开(公告)号: | CN102201048A | 公开(公告)日: | 2011-09-28 |
发明(设计)人: | 赵彧;李建强;刘博;郭剑峰 | 申请(专利权)人: | 日电(中国)有限公司 |
主分类号: | G06F21/24 | 分类号: | G06F21/24 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 宋鹤;南霆 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 集合 进行 主题 级别 隐私 保护 方法 系统 | ||
技术领域
本发明一般的涉及文档集合的隐私保护,更具体而言,涉及对文档集合进行主题级别隐私保护的方法和系统。
背景技术
随着计算机和网络技术的快速发展,人们可获得的信息已经呈现数字化和海量化的特征。然而,数字化和网络化也使得对信息进行隐私保护和管理变得更具挑战性。特别是在涉及对健康信息、账户信息等高私密性信息的场合中,这个问题尤其迫切的需要得到解决。例如,目前为了便于医疗信息共享,电子病历及电子健康档案的使用已成为趋势,医务工作者、医学研究者、卫生部门、保险公司等医疗相关人员可以方便地基于电子医疗数据进行相关业务工作,然而从病人的角度看,他们应该对有关其本人的病历或健康档案拥有隐私控制权,最典型的情境则是病人不希望某些没有经过其授权的人,通过获取到的电子医疗数据能够得知其患有某种敏感疾病。
现在,搜索已经成为人们处理海量数字信息的基本工具,而如何使得搜索者快速、方便、准确的获得其需要的信息,同时又能保护信息所有者或者信息内容相关人的隐私不被泄露,即实现搜索质量和隐私保护的平衡,成为搜索系统需要面对的一个难题。
通常情况下,文档所有者或者隐私相关人通过制定隐私策略(privacypolicy)来个性化定义隐私的范围以及对于隐私相关信息的保护策略。兼顾隐私保护的搜索(privacy-preserving search)需要解决的问题就是如何在搜索系统中满足隐私策略,同时保持尽可能高的搜索质量。
在实际搜索系统中,访问控制是最常用也是最有效的隐私控制方法,即隐私所有人对包含隐私信息的文档设置访问控制策略,设定有权限或者无权限获取隐私文档的搜索者。基于访问控制的隐私保护通常包含三个步骤:(1)隐私策略的定义:隐私所有人确定隐私的涵义和范围;(2)隐私文档的判定:判断一个文档是否包含隐私内容;(3)访问控制的设定:为每个隐私文档设定访问策略。面对大量文档时,隐私所有人不可能手工的对每个文档进行逐一的隐私判定和访问控制设定。另外,当隐私所有人更改其隐私策略时,也不可能手工的再逐一的对文档进行重新判定和设定。基于隐私策略,如何实现自动的判定隐私文档以及设定访问控制,同时保证访问控制的准确性,是面对大量文档时需要解决的问题。
在现有技术中存在如下技术用于处理上述问题:
在题为“Method,System and Apparatus for Maintaining User Privacy in aKnowledge Interchange System”的欧洲专利EP1638032A3(递交于2005年9月6日)所提出的系统中,允许用户定义关键字级别(keyword-level)的隐私策略,即确定某些敏感关键字。包含这些敏感关键字的用户文档信息将不被传送到服务器上供共享,从而达到访问控制及隐私保护的目的。
另外,题为“Uniform Search System and Method for Selectively SharingDistributed Access-Controlled Documents”的美国专利US7409406B2(递交于2003年9月8日)将访问控制的执行权传递给文档所有者(隐私相关人)自己,而不是由搜索服务器来担当。每个文档所有者存储自己的文档(包含隐私文档及非隐私文档)。服务器仅仅保存已做过隐私保护的文档索引。当服务器接受到搜索查询时,根据索引,服务器将查询转发给相关文档所有者,然后由文档所有者自行根据其隐私策略和访问控制策略来响应查询。
还有,题为“Augmenting Privacy Policies with Inference Detection”的美国专利US2009/0144255A1(递交于2007年11月29日)支持用户定义主题级别(topic-level)的隐私策略,即用户可以定义特定的敏感主题,所有涉及敏感主题的文档都应该被判定为隐私文档。敏感主题是用一个或者一组主题关键字来表示的。该专利针对每个隐私策略(敏感主题),准备一组已经人工判定好的相应敏感文档作为训练文档,然后通过自然语言统计分析(statistical natural language analysis)的方法,从训练文档里面学习新的可以表示该敏感主题的关键字,随和这些新生成的关键字联合用于定义主题的关键字,一起作为用于判定隐私文档的关键字集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010132593.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种海参胶囊及其制备方法
- 下一篇:一种鲜花酱的制备工艺