[发明专利]一种互联网人物搜索信息整合分析控制方法有效

申请号：	201711451026.8	申请日：	2017-12-27
公开（公告）号：	CN108009298B	公开（公告）日：	2021-08-31
发明（设计）人：	刘婧;李坤	申请（专利权）人：	海口经济学院
主分类号：	G06F16/951	分类号：	G06F16/951;G06F16/953;G06F16/9532
代理公司：	北京国坤专利代理事务所(普通合伙) 11491	代理人：	赵红霞
地址：	571127 海南省海***	国省代码：	海南;46
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种互联网人物搜索信息整合分析控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种互联网人物搜索信息整合分析控制方法，其特征在于，所述互联网人物搜索信息整合分析控制方法包括：

用户在输入界面输入所要搜索的信息，并将输入的信息传输给信息提取模块；信息提取模块对用户在输入界面输入的信息进行提取，并将信息传输给网页搜索模块；

网页搜索模块对信息提取模块提取出的信息在网页上进行搜索；网页信息集合模块对搜索到的信息进行集合，对网页搜索模块搜索到的零碎信息进行整合；

信息分类提取模块对集合后的信息进行分类提取，采用数据处理分析算法，对集合信息进行分析处理，利用分布式的程序算法，缩短信息处理时间；信息比对模块比对分类提取的数据与信息存储模块中存储的数据，当信息不匹配或信息存储模块中缺少本信息时，对信息存储模块进行更新；当信息相同时，可以提取信息存储模块中的数据；

信息整合模块将信息比对模块中的数据进行整合，将身份信息、账户信息、社交信息整合为所搜索人物的详细资料；显示模块显示出信息整合模块整合后的所搜索人物的详细资料；

所述分布式的程序算法包括；

步骤一，根据待验证的程序，生成控制流图CFG，给CFG中的结点添加3个属性:R插值，S插值和E插值，R插值是结点可达的约束条件，判断一个状态的可达性；S插值和E插值对路径进行规约，加快程序的验证；给CFG的边添加属性W；一条边的W值表示以该边指向的结点为根结点的子图中，还没有被遍历的分支的个数；具体包括：

(1)找到CFG中的目标结点，从目标结点开始反向遍历CFG，遍历的结点和边都保留，没有遍历到的结点和边都删除；

(2)得到裁剪后的CFG，初始化属性的值，对各个结点的三种插值进行初始化，初次遍历CFG，生成ARG的过程中，每一个结点的R插值的初始值都为{true}；对于S插值，定义了为一个二元组:(F,I_s)，其中，F的值域为{full,half}，I_s的值是一个由谓词组成的合取式；对于一个结点l，如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f，表示l的所有后继结点都被遍历过，则l的S插值也是full，否则，l的S插值为half，记为h，具体的形式如下：

l是终结点，S插值的初始值为(full,true)，表示如果到达终结点，路径一定是安全的；l是目标结点，S插值的初始值为(full,false)，表示如果到达目标结点，路径一定是反例路径；对于其他结点，S插值的初始值为(half,true)，具体的形式如下:

l是目标结点，E插值的初始值为true，表示路径一定是真反例；l是终结点，E插值的初始值为false，表示路径一定不可能到达目标结点；对于其他结点，E插值的初始值为false，初始认为都不能到达目标结点；对于每一条迁移的W属性，初始值为⊥，表示还没开始遍历，其中，W的值域为{N+,⊥}，N+是正整数集合；

步骤二，根据生成的CFG，生成抽象可达图ARG，如果沿着一条路径生成一个新状态s，如果s对应的R插值被满足，说明状态s可达，继续沿着状态s遍历该路径；否则，状态s不可达，则该路径终止，遍历其他路径；对于一个可达的状态s，如果状态s对应的E插值被该路径对应的路径公式蕴含，说明沿着该状态存在一条到达目标状态的路径，程序不安全；如果状态s对应的S插值被蕴含，说明以状态为起点的所有路径都是安全的，不需要沿着状态s探索程序；如果状态s是可达的，且E插值和S插值都不被蕴含，则继续沿着状态s遍历该路径；具体的步骤包括：

(1)得到一个可达状态s'，根据CFG的迁移关系，产生后继状态；如果存在多个可能的后继，根据边的W值，决定遍历顺序；边的W值的优先级为：(0)⊥0；如果边的W值相同，则随机选择；对于一个后继状态s，根据R插值，如果状态s不可达，则当前路径终止，遍历其他路径；如果当前状态s可达，首先判断s的E插值是否为false；如果是false，说明s[0]的后继结点还没被遍历过，跳转到(2)；如果不是false,首先采用SSA原则，每一个变量至多被赋值一次，得到从初始状态s₀到达s的路径公式，记为P_f(s₀,…,s)；用求解器判断P_f(s₀,…,s)是否蕴含s的E插值；如果蕴含，则说明程序存在一条真反例，程序不安全，验证结束；否则跳转到(2)；

(2)判断s的S插值是否为full插值；如果不是full插值，则跳转到(3)；如果是full插值，得到从初始状态s₀到达s的路径公式，记为P_f(s₀,…,s)，然后用求解器判断P_f(s₀,…,s)是否蕴含s的S插值；如果蕴含，则说明以状态s为起点的所有路径都是安全的，不需要探索，当前路径终止，遍历其他路径；

(3)判断s是否目标状态，如果是目标状态，则发现一条反例路径，执行步骤三；如果不是，进一步判断s是否被其他状态覆盖；如果s被覆盖，则不需要探索当前路径，遍历其他路径；如果s不被覆盖，则继续探索当前路径；

(4)如果存在没有被遍历的可达状态，则跳转到(1)；否则，验证结束，程序安全；

步骤三，在生成ARG的过程中，发现一条反例路径，到达目标状态，则需要进一步判断反例路径是否虚假；不是虚假反例，则说明程序是不安全的；否则，根据虚假反例，细化模型，分别计算并更新对应状态的R插值，S插值和E插值，执行重新生成ARG，直到找到一条真反例路径或不存在反例路径；具体步骤包括：

1)在生成ARG的过程中，发现一条反例路径path:〈s₀,e₀,s₁,…,e_n-1,s_n〉；利用SMT求解器判断path是不是虚假；如果path是真反例，则程序不安全，验证结束；如果path是虚假的，则执行2)；

2)计算R插值，对于状态s_i，0in，将path划分为两部分：pre和post；pre子序列为s₀,…,s_i，post子序列为s_i,…,s_n，利用Craig插值公式计算新的R插值，Craig(pre,post)，更新s_i[0]的R插值，形式化地表示为：

R-Intp(s_i[0])＝R-Intp(s_i[0])∪Craig(P_f(s₀,..,s_i),P_f(s_i,…,s_n))；

其中，Pf(s₀,…,s_i)表示从s₀到s_i的路径对应的路径公式；

3)计算S插值，首先找到path的可达的有效序列Π＝s₀,...,s_m，0mn，且s_i状态可达，s_i+1状态不可达；对于Π的每一个状态s_i，0i≤m，判断S插值的的第一个元素是full还是half；si[0]的所有后继结点的S插值都是full，则si[0]的S插值为full，否则，si[0]的S插值为half；具体的形式如下：

对于S插值的第二个元素，记为I_s(s_i[0]),分两种情况，如果i＝m,则I_s(s_i[0])是边e_i+1的路径公式取反；如果0im，I_s(s_i[0])利用Craig插值计算，记为Craig(A,B)；其中，A表示从s₀到s_i的路径公式，B是边e_i对应的公式和状态s_i+1对应的S插值取反的合取式；具体的形式如下:

其中，A＝P_f(s₀,…,s_i),B＝P_f(s_i,e_i,s_i+1)∧！(I_s(s_i+1[0])；从s_m状态开始倒序地计算每个状态的插值，直到初始状态或者某一状态的S插值为half；

4)计算E插值，找到path的最大有效后缀序列Π＝si,…,sn，0＜i≤n；从s_i状态开始，利用Craig插值，倒序地计算对应的E插值，记为Craig(A,B)；对于s_i，A₁是从s_i到s_n的路径公式和s_n的E插值的合取式，B₁是从s₀到s_i的路径公式；对于状态s_j，0＜j＜i,A₂是从s_j到s_j+1的路径公式和s_j+1的E插值的合取式，B₂是从s₀到s_j的路径公式，具体的形式如下：

5)计算边的W值，根据反例路径和更新后的S插值，来计算对应边的W值，对于一条边e:(s,op,s')，如果s'的S插值是full，则e的W值为0；如果s'的S插值是half,且s'是最后一个可达状态，e的W值为s'[0]的出边的个数-1；如果s'的S插值是half,且s'不是最后一个可达状态，e的W值为两部分的和：1)s'[0]的出边中W值不为⊥的边的W值的和，2)s'[0]的出边中W值为⊥的边的个数；对于边e:(s,op,s')，s':(l',c',p')具体的形式如下：

6)跳转到步骤二，重新生成ARG；

所述对信息存储模块进行更新的方法包括：

接收维护更新指令；

根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息；

根据所述维度表信息获取预先设置的维度表配置信息；其中，所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息；

根据所述用户搜索的信息以及所述维度表操作权限信息，判断所述用户搜索的信息是否满足所述维度表操作权限信息；

若所述用户搜索的信息足所述维度表操作权限信息，对所述需要维护更新的维度表进行更新操作；

将进行更新操作后的维度表同步到所述信息存储模块；

所述维度表操作权限信息包括：具有维度表操作权限的用户搜索的信息标识；

所述判断所述用户搜索的信息是否满足所述维度表操作权限信息，包括：

判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中；

所述维护更新指令为增加内容指令、更改内容指令或删除内容指令；