[发明专利]一种基于语义关联网络的启发式查询扩展方法有效

专利信息
申请号: 201710468786.3 申请日: 2017-06-20
公开(公告)号: CN107832319B 公开(公告)日: 2021-09-17
发明(设计)人: 郭黎敏;李童;高需;苏醒;丁治明 申请(专利权)人: 北京工业大学
主分类号: G06F16/9532 分类号: G06F16/9532;G06F40/30
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 张慧
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 语义 关联 网络 启发式 查询 扩展 方法
【权利要求书】:

1.一种基于语义关联网络的启发式查询扩展方法,其特征在于,包括以下步骤:

步骤1、根据本体中抽取的概念,建立关联图,其中,所述关联图用RG=(V,E)表示,V是节点的集合,v是一个概念,用语义标签A表示;E是边的集合,e=(vi,vj,rw)表示vi和vj之间有关联,且其关联权重为rw;所述查询用Q=(A1,A2,…,Am)表示,Ai表示第i个查询条件对应的概念;

步骤2、根据查询Q和关联图RG,构造最小查询生成树MQST,同时根据所述最小查询生成树MQST对查询中的节点进一步进行有效路径扩展;

步骤1构建关联图的方法包括如下:

步骤1-1、从本体中抽取领域内的概念集AS,将概念集中的概念作为关联图的节点,并初始化各概念对之间的关联权重为0;

步骤1-2、抽取统计窗口Wd内的关联矩阵集合RMS’,并累加计算节点间的关联度的时间权重的加权和;

步骤1-3、计算节点间的关联权重,若存在关联,则添加关联图的边;

步骤1-2所述关联矩阵的计算方法包括如下:

步骤1-2-1、从本体中抽取领域内的概念集AS,然后扫描文本集ST,查看每个概念是否在ST中出现,初始化统计矩阵OM,其中,所述文本集用ST=(st1,st2,…,stn)表示,统计矩阵OM记录概念是否在文本中出现,其中,行表示文本,列表示概念,OM[i,j]表示第j个概念是否在第i个文本中出现;

步骤1-2-2、逐个计算共现率和关联度,如果满足强关联条件,即共现率大于等于最小共现率且关联度大于等于最小关联度,将其保存在关联矩阵RM中,其中,在所述文本集ST=(st1,st2,…,stn)中,概念的A1和A2的共现率为其中表示A1和A2在sti中的共现情况;概念的A1和A2的关联度为其中CP(A1,A2)是A1和A2在ST中的共现率,OP(Ai)是Ai在ST中出现的概率;统计矩阵RM记录概念之间的共现率和关联度,其中行、列表示概念,RM[i,j].cp表示第i个概念与第j个概念的共现率,RM[i,j].rp表示第i个概念与第j个概念的关联度;

步骤1-2中所述统计窗口用Wd={tk-n,tk-n+1,…,tk}表示;时间权重WT(tl,tk)=1/2(tk-tl),其中tk为当前的时间段,tl(l≤k)为任一时间段;

步骤1-3中所述概念对(Ai,Aj)的关联权重为其中Wd为统计窗口,WT(tl,tk)为时间权重,是Ai、Aj在时间段tl的关联度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710468786.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top