[发明专利]一种互联网人物搜索信息整合分析控制方法有效
申请号: | 201711451026.8 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108009298B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 刘婧;李坤 | 申请(专利权)人: | 海口经济学院 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/953;G06F16/9532 |
代理公司: | 北京国坤专利代理事务所(普通合伙) 11491 | 代理人: | 赵红霞 |
地址: | 571127 海南省海*** | 国省代码: | 海南;46 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 互联网 人物 搜索 信息 整合 分析 控制 方法 | ||
1.一种互联网人物搜索信息整合分析控制方法,其特征在于,所述互联网人物搜索信息整合分析控制方法包括:
用户在输入界面输入所要搜索的信息,并将输入的信息传输给信息提取模块;信息提取模块对用户在输入界面输入的信息进行提取,并将信息传输给网页搜索模块;
网页搜索模块对信息提取模块提取出的信息在网页上进行搜索;网页信息集合模块对搜索到的信息进行集合,对网页搜索模块搜索到的零碎信息进行整合;
信息分类提取模块对集合后的信息进行分类提取,采用数据处理分析算法,对集合信息进行分析处理,利用分布式的程序算法,缩短信息处理时间;信息比对模块比对分类提取的数据与信息存储模块中存储的数据,当信息不匹配或信息存储模块中缺少本信息时,对信息存储模块进行更新;当信息相同时,可以提取信息存储模块中的数据;
信息整合模块将信息比对模块中的数据进行整合,将身份信息、账户信息、社交信息整合为所搜索人物的详细资料;显示模块显示出信息整合模块整合后的所搜索人物的详细资料;
所述分布式的程序算法包括;
步骤一,根据待验证的程序,生成控制流图CFG,给CFG中的结点添加3个属性:R插值,S插值和E插值,R插值是结点可达的约束条件,判断一个状态的可达性;S插值和E插值对路径进行规约,加快程序的验证;给CFG的边添加属性W;一条边的W值表示以该边指向的结点为根结点的子图中,还没有被遍历的分支的个数;具体包括:
(1)找到CFG中的目标结点,从目标结点开始反向遍历CFG,遍历的结点和边都保留,没有遍历到的结点和边都删除;
(2)得到裁剪后的CFG,初始化属性的值,对各个结点的三种插值进行初始化,初次遍历CFG,生成ARG的过程中,每一个结点的R插值的初始值都为{true};对于S插值,定义了为一个二元组:(F,Is),其中,F的值域为{full,half},Is的值是一个由谓词组成的合取式;对于一个结点l,如果l没有后继结点或者l的所有后继结点的S插值都是full,记为f,表示l的所有后继结点都被遍历过,则l的S插值也是full,否则,l的S插值为half,记为h,具体的形式如下:
l是终结点,S插值的初始值为(full,true),表示如果到达终结点,路径一定是安全的;l是目标结点,S插值的初始值为(full,false),表示如果到达目标结点,路径一定是反例路径;对于其他结点,S插值的初始值为(half,true),具体的形式如下:
l是目标结点,E插值的初始值为true,表示路径一定是真反例;l是终结点,E插值的初始值为false,表示路径一定不可能到达目标结点;对于其他结点,E插值的初始值为false,初始认为都不能到达目标结点;对于每一条迁移的W属性,初始值为⊥,表示还没开始遍历,其中,W的值域为{N+,⊥},N+是正整数集合;
步骤二,根据生成的CFG,生成抽象可达图ARG,如果沿着一条路径生成一个新状态s,如果s对应的R插值被满足,说明状态s可达,继续沿着状态s遍历该路径;否则,状态s不可达,则该路径终止,遍历其他路径;对于一个可达的状态s,如果状态s对应的E插值被该路径对应的路径公式蕴含,说明沿着该状态存在一条到达目标状态的路径,程序不安全;如果状态s对应的S插值被蕴含,说明以状态为起点的所有路径都是安全的,不需要沿着状态s探索程序;如果状态s是可达的,且E插值和S插值都不被蕴含,则继续沿着状态s遍历该路径;具体的步骤包括:
(1)得到一个可达状态s',根据CFG的迁移关系,产生后继状态;如果存在多个可能的后继,根据边的W值,决定遍历顺序;边的W值的优先级为:(0)⊥0;如果边的W值相同,则随机选择;对于一个后继状态s,根据R插值,如果状态s不可达,则当前路径终止,遍历其他路径;如果当前状态s可达,首先判断s的E插值是否为false;如果是false,说明s[0]的后继结点还没被遍历过,跳转到(2);如果不是false,首先采用SSA原则,每一个变量至多被赋值一次,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s);用求解器判断Pf(s0,…,s)是否蕴含s的E插值;如果蕴含,则说明程序存在一条真反例,程序不安全,验证结束;否则跳转到(2);
(2)判断s的S插值是否为full插值;如果不是full插值,则跳转到(3);如果是full插值,得到从初始状态s0到达s的路径公式,记为Pf(s0,…,s),然后用求解器判断Pf(s0,…,s)是否蕴含s的S插值;如果蕴含,则说明以状态s为起点的所有路径都是安全的,不需要探索,当前路径终止,遍历其他路径;
(3)判断s是否目标状态,如果是目标状态,则发现一条反例路径,执行步骤三;如果不是,进一步判断s是否被其他状态覆盖;如果s被覆盖,则不需要探索当前路径,遍历其他路径;如果s不被覆盖,则继续探索当前路径;
(4)如果存在没有被遍历的可达状态,则跳转到(1);否则,验证结束,程序安全;
步骤三,在生成ARG的过程中,发现一条反例路径,到达目标状态,则需要进一步判断反例路径是否虚假;不是虚假反例,则说明程序是不安全的;否则,根据虚假反例,细化模型,分别计算并更新对应状态的R插值,S插值和E插值,执行重新生成ARG,直到找到一条真反例路径或不存在反例路径;具体步骤包括:
1)在生成ARG的过程中,发现一条反例路径path:〈s0,e0,s1,…,en-1,sn〉;利用SMT求解器判断path是不是虚假;如果path是真反例,则程序不安全,验证结束;如果path是虚假的,则执行2);
2)计算R插值,对于状态si,0in,将path划分为两部分:pre和post;pre子序列为s0,…,si,post子序列为si,…,sn,利用Craig插值公式计算新的R插值,Craig(pre,post),更新si[0]的R插值,形式化地表示为:
R-Intp(si[0])=R-Intp(si[0])∪Craig(Pf(s0,..,si),Pf(si,…,sn));
其中,Pf(s0,…,si)表示从s0到si的路径对应的路径公式;
3)计算S插值,首先找到path的可达的有效序列Π=s0,...,sm,0mn,且si状态可达,si+1状态不可达;对于Π的每一个状态si,0i≤m,判断S插值的的第一个元素是full还是half;si[0]的所有后继结点的S插值都是full,则si[0]的S插值为full,否则,si[0]的S插值为half;具体的形式如下:
对于S插值的第二个元素,记为Is(si[0]),分两种情况,如果i=m,则Is(si[0])是边ei+1的路径公式取反;如果0im,Is(si[0])利用Craig插值计算,记为Craig(A,B);其中,A表示从s0到si的路径公式,B是边ei对应的公式和状态si+1对应的S插值取反的合取式;具体的形式如下:
其中,A=Pf(s0,…,si),B=Pf(si,ei,si+1)∧!(Is(si+1[0]);从sm状态开始倒序地计算每个状态的插值,直到初始状态或者某一状态的S插值为half;
4)计算E插值,找到path的最大有效后缀序列Π=si,…,sn,0<i≤n;从si状态开始,利用Craig插值,倒序地计算对应的E插值,记为Craig(A,B);对于si,A1是从si到sn的路径公式和sn的E插值的合取式,B1是从s0到si的路径公式;对于状态sj,0<j<i,A2是从sj到sj+1的路径公式和sj+1的E插值的合取式,B2是从s0到sj的路径公式,具体的形式如下:
5)计算边的W值,根据反例路径和更新后的S插值,来计算对应边的W值,对于一条边e:(s,op,s'),如果s'的S插值是full,则e的W值为0;如果s'的S插值是half,且s'是最后一个可达状态,e的W值为s'[0]的出边的个数-1;如果s'的S插值是half,且s'不是最后一个可达状态,e的W值为两部分的和:1)s'[0]的出边中W值不为⊥的边的W值的和,2)s'[0]的出边中W值为⊥的边的个数;对于边e:(s,op,s'),s':(l',c',p')具体的形式如下:
6)跳转到步骤二,重新生成ARG;
所述对信息存储模块进行更新的方法包括:
接收维护更新指令;
根据所述维护更新指令获取用户搜索的信息以及需要维护更新的维度表的维度表信息;
根据所述维度表信息获取预先设置的维度表配置信息;其中,所述维度表配置信息中带有所述需要维护更新的维度表所在的源数据库、所述维度表需要同步的目的数据库以及维度表操作权限信息;
根据所述用户搜索的信息以及所述维度表操作权限信息,判断所述用户搜索的信息是否满足所述维度表操作权限信息;
若所述用户搜索的信息足所述维度表操作权限信息,对所述需要维护更新的维度表进行更新操作;
将进行更新操作后的维度表同步到所述信息存储模块;
所述维度表操作权限信息包括:具有维度表操作权限的用户搜索的信息标识;
所述判断所述用户搜索的信息是否满足所述维度表操作权限信息,包括:
判断所述用户搜索的信息是否在所述具有维度表操作权限的用户搜索的信息标识中;
所述维护更新指令为增加内容指令、更改内容指令或删除内容指令;
在对所述需要维护更新的维度表进行更新操作之前,包括:
根据所述维护更新指令,确定需要维护更新的字段,并获取到所述需要维护更新的字段标识;
根据所述字段标识以及所述维度表配置信息获取到预先设置的字段配置信息;其中,所述字段配置信息包括所述字段的字段内容排序规则、字段次序信息、字段限制条件;
若所述维护更新指令为增加内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述增加内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中增加字段内容;
根据所述字段内容排序规则,将所述字段内容进行排序;
根据所述字段次序信息,将维度表中的各个字段进行排序;
若所述维护更新指令为更改内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
获取所述更改内容指令对应的批量数据内容;
根据所述批量数据内容,在所述维度表中的一个或多个字段中更改字段内容;
若所述维护更新指令为删除内容指令,所述对所述需要维护更新的维度表进行更新操作,包括:
在所述维度表中的一个或多个字段中删除字段内容;
判断所述增加字段内容、更改字段内容或者删除字段内容之后的各字段是否满足所述字段限制条件;
若有字段不满足所述字段限制条件,生成提示信息;所述提示信息用于提示不满足所述字段限制条件的字段数,并提示不满足所述字段限制条件的字段相关信息;所述字段相关信息包括所述字段的所述字段标识或者字段名称;所述段相关信息为搜索的零碎信息;
在步骤一中,生成程序对应的CFG,根据目标结点,遍历整个CFG减掉不可能到达目标状态的结点和边;
在步骤三中,如果存在一条虚假反例路径,在计算三种插值的同时,计算反例路径中每一条边的W值;在步骤二中,一个状态如果存在多个后继状态,根据边的W值,决定后继状态的遍历顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海口经济学院,未经海口经济学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711451026.8/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置