[发明专利]一种基于信息熵的公共安全数据分级索引方法及装置有效

专利信息
申请号: 202010072369.9 申请日: 2020-01-21
公开(公告)号: CN111274349B 公开(公告)日: 2020-12-15
发明(设计)人: 徐继宁;丁辉;雷振伍;李超;刘硕;史运涛;刘大千;吴晗;武国亮;于运渌 申请(专利权)人: 北方工业大学
主分类号: G06F16/31 分类号: G06F16/31;G06F16/33
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 苗晓静
地址: 100144 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信息 公共安全 数据 分级 索引 方法 装置
【权利要求书】:

1.一种基于信息熵的公共安全数据分级索引方法,其特征在于,包括:

获取待查询公共安全数据的关键字;

根据预设索引结构对所述关键字进行索引;其中,所述预设索引结构是根据由信息熵表示的、表征各关键字之间关联程度的互信息量确定的分级索引结构;

还包括:

预先构建所述预设索引结构,具体包括:

获取由各根节点关键字分别表示的词频表;所述词频表记录有属于同一根节点关键字的各数据关键字的词频数;

根据所述各根节点关键字对应的词频表数量、属于同一根节点关键字的各数据关键字的词频数,确定各数据关键字分别对应的信息熵;

根据各数据关键字分别对应的信息熵,确定所述互信息量;

确定各根节点关键字为所述预设索引结构中的根节点,根据所述互信息量,确定与所述互信息量相对应的数据关键字为所述根节点下的分级节点,并根据所有分级节点构建所述预设索引结构;

所述根据所述互信息量,确定与所述互信息量相对应的数据关键字为所述根节点下的分级节点,并根据所有分级节点构建所述预设索引结构,包括:

按照所述互信息量的互信息量数值大小顺序排列所述互信息量,并将前n个互信息量对应的关键字作为所述根节点的下一级分级节点;

将在前n个互信息量之后的m个互信息量对应的关键字作为所述下一级分级节点的下一级分级节点,并重复执行,直到遍历完成全部互信息量对应的关键字。

2.根据权利要求1所述的基于信息熵的公共安全数据分级索引方法,其特征在于,所述根据预设索引结构对所述关键字进行索引,包括:

从所述预设索引结构的根节点开始逐级遍历所述关键字,并进行索引。

3.根据权利要求2所述的基于信息熵的公共安全数据分级索引方法,其特征在于,所述根据所述各根节点关键字对应的词频表数量、属于同一根节点关键字的各数据关键字的词频数,确定各数据关键字分别对应的信息熵,包括:

根据所述各根节点关键字对应的词频表数量,确定属于同一根节点关键字的全部数据关键字对应的权重;

根据属于同一根节点关键字的各数据关键字的词频数,确定各数据关键字在与其对应的根节点关键字所表示的词频表中出现的概率;

根据所述权重和所述概率,确定各数据关键字分别对应的信息熵。

4.根据权利要求3所述的基于信息熵的公共安全数据分级索引方法,其特征在于,所述根据所述权重和所述概率,确定各数据关键字分别对应的信息熵,包括:

根据如下公式计算各数据关键字分别对应的信息熵:

其中,H(X)为与关键字x对应的信息熵、λ为所述权重、P(x)为所述概率、x为所述关键字、X为包含有所述词频表的关键字集合。

5.根据权利要求2所述的基于信息熵的公共安全数据分级索引方法,其特征在于,所述根据各数据关键字分别对应的信息熵,确定所述互信息量,包括:

根据如下公式确定所述互信息量:

I(X;Y)=H(Y)-H(Y|X)

其中,I(X;Y)为所述互信息量、H(Y)为与关键字x关联的关键字y对应的信息熵、H(Y|X)根据如下公式进行计算:

其中,H(Y|X)为y对x的期望、p(x,y)为关键字x和关键字y在与其对应的根节点关键字所表示的词频表中同时出现的概率、p(y|x)为关键字x在与其对应的根节点关键字所表示的词频表中出现的条件下关键字y出现的概率。

6.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述方法的步骤。

7.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机

程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010072369.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top