[发明专利]一种用户隐私数据分析方法及装置在审
申请号: | 202011640965.9 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112733186A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 周勇;仰守浩 | 申请(专利权)人: | 上海竞动科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2457;G06F16/2458;G06F16/335;G06F16/83 |
代理公司: | 北京北汇律师事务所 11711 | 代理人: | 马亚坤 |
地址: | 200940 上海市宝*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 隐私 数据 分析 方法 装置 | ||
1.一种用户隐私数据分析方法,其特征在于:包括下列步骤:
S100、数据采集:获得涉及用户隐私的初始数据;所述初始数据的采集方式包括文本格式采集、XML表单或者其它描述性格式采集;
S200、构建规则树:根据知识挖掘预先构建规则树,所述规则树包括按逻辑关系关联的字段名和关键词;
S300、元数据集合构建:将所述初始数据与规则树进行匹配,从所述初始数据中自动提取字段名和字段属性值的元数据,并依据规则树的逻辑关系生成元数据集合;
S400、元数据集合映射:元数据集合映射至分布式特征集合进行匹配,获得分布式特征组;所述分布式特征集合用于从元数据集合里面中提取分布式特征;所述分布式特征集合当中包含多种类型的分布式特征,每一种类型的分布式特征当中均具有该类型相应的权重参数值;
S500、数据输出:将元数据集合的分布式特征组进行网络传输,提供给数据分析者进行存储和分析。
2.根据权利要求1所述的一种用户隐私数据分析方法,其特征在于:所述S300元数据集合构建中,对于文本格式采集的初始数据,将其文本内容与规则树的字段名、描述关键词进行检索比对,然后从初始数据中自动提取字段名和字段属性值的元数据,并且元数据参照规则树的逻辑关系进行组织,形成元数据集合;
对于XML表单或者其它描述性格式采集的初始数据,采用字段匹配的方式,把XML或者其它描述标签与规则树的字段名、描述关键词进行匹配,从初始数据中自动提取字段名和字段属性值的元数据,并且元数据参照规则树的逻辑关系进行组织,形成元数据集合。
3.根据权利要求1所述的一种用户隐私数据分析方法,其特征在于:所述S400数据映射,具体包括如下步骤:
S410、将分布式特征集合与元数据集合参照其结构关联进行匹配,获得分布式特征集合与元数据集合的匹配度;元数据集合中字段名的字段属性值落入第k个分布式特征的同字段名取值区间的次数Mk作为该分布式特征与元数据集合的匹配度。
4.根据权利要求3所述的一种用户隐私数据分析方法,其特征在于:所述S400数据映射,还包括如下步骤:
S420、根据分布式特征集合的权重参数值以及分布式特征集合与元数据集合的匹配度,确定分布式特征组的特征值;根据分布式特征集合中的每个分布式特征的权重参数值Vk以及分布式特征与元数据集合的匹配度Mk,确定元数据集合的分布式特征值组中的特征值,元数据集合对应于第k个分布式特征的特征值
其中l2,l3为经验常数;
则元数据集合对应于分布式特征集合的各个分布式特征的特征值,组合在一起形成:<T1,T2,…TK…>即作为该元数据集合的分布式特征组。
5.根据权利要求4所述的一种用户隐私数据分析方法,其特征在于:所述步骤S420中,对于分布式特征具有N个字段名,则该分布式特征的权重参数值为:
其中k表示分布式特征集合中的第k个类型的分布式特征,VK为第k个分布式特征的权重参数值;i为字段名的序号,共N个字段名;l1为常数系数,以经验值确定其取值,Si为第i个字段名的取值区间范围的量化值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海竞动科技有限公司,未经上海竞动科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011640965.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文本分析方法、装置、电子设备及可读存储介质
- 下一篇:一种数据开放平台
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置