[发明专利]基于属性拓扑的博客数据的形式概念计算方法有效
申请号: | 201410288698.1 | 申请日: | 2014-06-25 |
公开(公告)号: | CN104036013B | 公开(公告)日: | 2017-10-20 |
发明(设计)人: | 张涛;李慧;魏昕宇 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 秦皇岛一诚知识产权事务所(普通合伙)13116 | 代理人: | 李合印 |
地址: | 066004 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于属性拓扑的博客数据的形式概念计算方法。该方法将博客数据的形式背景进行属性拓扑表示,通过加入全局起点和全局终点以及相关边将博客数据的属性拓扑退化为一个具有起点和终点的图;通过条件约束和计算规则的限定,对固有排序的属性节点重复进行搜索和回溯来完成路径的遍历;在对全局起点和全局终点之间的所有路径进行遍历的过程中得到博客数据所有的形式概念。本发明将属性拓扑构造成一个完整的整体,避免了属性拓扑的分解过程,体现了算法的完整性。同时在路径的遍历过程中获得形式概念的直观计算过程,可视性较好。 | ||
搜索关键词: | 基于 属性 拓扑 博客 数据 形式 概念 计算方法 | ||
【主权项】:
一种基于属性拓扑的博客数据的形式概念计算方法,其特征在于:该方法内容包括如下步骤:1)形式背景的属性拓扑表示从图论的角度看,属性拓扑表示是关于属性间关系的加权图表示,因此在存储上可以借鉴图的存储方式,对属性拓扑进行邻接矩阵描述;形式背景K:=(G,M,I)中,定义T=(V,Edge)为属性拓扑的邻接矩阵,其中V=M为拓扑的顶点集合,Edge为拓扑中边的权值集合;属性拓扑的邻接矩阵表达式如下所示:全局属性是指形式背景中全部的对象均包含的属性;空属性是指形式背景中不属于任何对象的属性;定义1在属性拓扑中,若对任意的Edge(mi,mj)≠Φ,都有Edge(mj,mi)≠Φ,则属性mj为顶层属性;顶层属性在属性拓扑图中的直观表示为其所连接的边均为双向边和单向出边;定义2在K:=(G,M,I)中,mi∈M;若存在集合N,对于且都满足则属性mi为属性mj的伴生属性,属性mj为属性mi的父属性;属性m可以为多个属性的伴生,即m可以有多个父属性;伴生属性m的所有父属性构成m的父属性集,记做F(m);顶层属性必不是伴生属性;2)伪父属性对的确定定义3设一伴生属性a,定义非空集合Pia为属性a的第i个伪父属性对,非空集合为与Pia一一对应的对象集,则满足都有在形式背景中,可能存在非空集合对都有且即伴生属性a可以有多个不同的伪父属性对;伴生属性a的所有不同的伪父属性对构成集合为在属性拓扑中,伴生属性a及其任一伪父属性对构成的MT={mi|mi∈a∪{Pia}}必定为完全多边形;对伴生属性a,满足即a的任意两个伪父属性对中不包含相同的属性;伴生属性a的任一伪父属性对中都不包含a的父属性;3)属性拓扑的退化在原拓扑基础上加入节点Ψ和E,g(Ψ)=G,g(E)=Φ,Ψ作为全局起点,E作为全局终点;设集合对构造单向边<Ψ,mi>,同时令Edge(Ψ,mi)=g(mi),对令<mj,E>=End,其中End为终结符;为了统一表述,画图中采用单向边描述;拓扑退化分以下两种情况:(i)不存在伴生属性则令A=M且B=M,即令Edge(Ψ,m)=g(m),同时令<m,E>=End,(ii)存在伴生属性则令A为顶层属性集,B为伴生属性集,则A∪B=M,且A∩B=Φ;4)节点的排序假设M为拓扑的全部属性集,顶层属性集为伴生属性集#{·}代表集合内元素的个数;对令num(mi)=#{n|Edge(n,mi)≠Φ,orEdge(mi,n)≠Φ,n∈M‑mi},定义4对于非空集合定义一种映射T:C→C满足:(1)---C→T(C)=ΔCT={c1,c2...ci|ck∈C,k∈[1,i]}]]>(2)num(c1)≤num(c2)≤...num(ci)由定义4可知,对于上述集合A,B,有AT={m1,m2,m3...mi},BT={n1,n2,n3...nj},由定义4可知集合AT是对集合A内所有元素重新排序后的结果,即AT为一个有序的集合;BT是以同样的规则对集合B内元素排序后的结果;令即由上述描述可知,做为一个有序集合,是在加入起点和终点的属性集合的基础上,对所有属性进行排序的结果;排在起点之后的为一系列的顶层属性,之后是一系列伴生属性,最后为加入的终点;后续算法中对节点的搜索和回溯都是在此基础上进行的;对有序集合而言,mi属于Next(mi)表示计算中mi的下一个元素;5)路径的表示设拓扑的全部属性集为X={x1,x2,x3...xm},共有m个属性定义5定义一种关系同时满足:(1)---ΛnX=∠(ΛnX)·θ(ΛnX)]]>(2)---∠(ΛnX)=g(X)]]>(3)---θ(ΛnX)=Δ<x1,x2...xn>]]>其中,满足:(1)---ΛnX={x1Λx2...Λxn|∀xi∈X,i∈[1,n]},]]>(2)n≤m(3)---x1Λx2≠x2Λx1,∀x1,x2∈X]]>(4)---(x1Λx2)Λx3=x1Λ(x2Λx3),∀x1,x2,x3∈X]]>(5)---x1Λx2Λx3=(x1Λx2)Λ(x2Λx3),∀x1,x2,x3∈X]]>由上述定义5可知,当时,由它的大小和方向唯一确定,它的大小用来表示,方向由来表示;路径依次经过的属性节点构成集合I,I={x1,x2...xn};6)主算法描述设原拓扑属性集合为X,#X=n‑2,共有n个属性,设属性类别集合为{0,1},表示属性xi的类别为Mark(xi),则令Mark(xi)∈{0,1};Step1初始化∠P=Φ,I=Φ,初始化初始化概念集C=Φ;Step2初始化v=Ψ令P={Ψ},C={(g(Ψ),{Ψ})};Step3当前遍历属性m=Next(v);Step4判断条件m=E,不满足则转至Step5;否则,转至Step8;Step5判断节点搜索的约束条件,满足则转至Step6;否则,转至Step7;Step6路径及数据更新;Step7 v=m,转至Step3;Step8判断条件P=Ψ,不满足则转至Step9;否则,将集合C中的每一个二元组({Ψ}∪A,B)更新为(A,B),算法结束;Step9进行节点回溯,集合C不改变,转至Step3;算法结束后,即得到了两点间的全部路径,同时集合C中每一个二元组即为一个形式概念,即博客数据形式背景K:=(G,M,I)下的全部概念集β(G,M,I)=C∪{(Φ,g(Φ))};在步骤6)的Step5中,所述节点搜索的约束条件判断步骤包括如下内容:(a)判断条件Edge(m,xi)≠Φ,orEdge(xi,m)≠Φ,满足则转至步骤(b);否则,转至步骤(g);(b)判断条件当前遍历属性m为伴生属性,满足则转至步骤(c);否则,转至步骤(g);(c)判断条件满足则转至步骤(d);否则,转至步骤(g);(d)判断条件Pm=Φ,满足则转至步骤(e);否则,转至步骤(g);(e)判断条件满足则转至步骤(f),否则,转至步骤(g);(f)判断条件g(I)∩g(m)≠Φ,满足则说明m满足节点搜索条件;不满足则转至步骤(g);(g)m不满足节点搜索条件;在步骤6)的Step6中,所述路径和数据更新的步骤包括如下内容:(a)路径更新P′=PΛ{m},同时∠P′=∠P∩g(m),I′=I∪{m};(b)判断条件∠P′=Edge(Last(I),m),满足则对原拓扑中Last(I)与m之间的单向边或者双向边进行移除;否则,原拓扑保持不变,Last(·)是有序集合的最后一个元素;(c)判断条件∠P′=∠P,满足则转至步骤(d);否则,转至步骤(e);(d)将生成的二元组(∠P′,I′)替代集合C中的元素(As,Bs)并令Mark(Last(I))=1;其中,As=∠P,s≤l;(e)将生成的二元组(∠P′,I′)加入到集合C中,即C=C∪{(∠P′,I′)};在步骤6)的Step9中,所述节点回溯的步骤包括如下内容:(a)Mark(Last(I))=1,I=I‑Last(I);(b)判断条件Mark(Last(I))=0,不满足则转至步骤(c);否则,转至步骤(d);(c)v=Last(I),I=I‑Last(I),Mark(v)=0,转至步骤(b);(d)m=Next(v)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410288698.1/,转载请声明来源钻瓜专利网。