[发明专利]网络信息源查找方法、装置及服务器有效
申请号: | 201711223777.4 | 申请日: | 2017-11-29 |
公开(公告)号: | CN107862081B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 肖仕刚;黄勇;陈航;宋国志 | 申请(专利权)人: | 四川无声信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 张红平 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 信息源 查找 方法 装置 服务器 | ||
1.一种网络信息源查找方法,其特征在于,包括:
依据舆情词组数据库,构建舆情词组概率空间;
提取单条舆情信息的词组序列,并结合所述舆情词组概率空间,构建语义联合概率矩阵;
利用所述语义联合概率矩阵和朴素贝叶斯分类算法获取所述单条舆情信息的威胁系数,结合所述语义联合概率矩阵构建节点语义树;
通过纵深探测算法从社交节点网络中获取节点交互网络拓扑分布,并构建双向节点关联矩阵,依据所述双向节点关联矩阵和所述节点语义树计算黏度匹配系数;
对所述双向节点关联矩阵进行向量转换,构成待分析的初始矩阵,并利用分层提取算法和所述黏度匹配系数获取信息源网络;
针对所述信息源网络构建信息源语义树,并结合节点交互网络拓扑分布及利用黏度延伸算法绘制信息源词组黏度分布图,所述黏度延伸算法用于将所述信息源语义树转化为节点在二维空间的散点分布,并根据节点树层级构建多级坐标系和基于基础向量确定节点偏差位置;
利用黏度聚类算法从所述信息源词组黏度分布图中提取信息源语义特性词组,并对信息源网络中的各节点自身的语义树进行关联分析,提取信息源。
2.根据权利要求1所述的网络信息源查找方法,其特征在于,所述依据舆情词组数据库,构建舆情词组概率空间的步骤还包括:
计算所述舆情词组数据库内各词组的引用概率,依据所述舆情词组数据库内的词组分布状态计算通用性概率,依据所述舆情词组数据库内各词组的使用时间分布计算时效系数;
依据所述引用概率、所述通用性概率以及所述时效系数构建舆情词组概率空间。
3.根据权利要求1或2所述的网络信息源查找方法,其特征在于,所述提取单条舆情信息的词组序列,并结合所述舆情词组概率空间,构建语义联合概率矩阵的步骤还包括:
提取单条舆情信息的词组序列;
根据所述词组序列中任意两词组同时出现频率构建频数矩阵,根据所述词组序列中任意两词组构成的舆情信息在词组概率空间中的威胁权重分布构建威胁权重分布矩阵,根据所述词组序列中任意两词组自身威胁权重乘积集成构建个体权重积矩阵,根据所述词组序列中任意两词组自身概率空间特性构建个体概率矩阵;
结合所述频数矩阵、所述威胁权重分布矩阵、所述个体权重积矩阵和所述个体概率矩阵构建语义联合概率矩阵。
4.根据权利要求3所述的网络信息源查找方法,其特征在于,所述利用所述语义联合概率矩阵和朴素贝叶斯分类算法获取所述单条舆情信息的威胁系数,结合所述语义联合概率矩阵构建节点语义树的步骤还包括:
采用条件独立假设评估单条舆情信息的整体合理性,采用马尔科夫随机场链联合概率假设来评估单条舆情信息的语义合理性,依据得到整体合理性和所述语义合理性,得到威胁系数,并结合所述语义联合概率矩阵构建节点语义树。
5.根据权利要求4所述的网络信息源查找方法,其特征在于,所述通过纵深探测算法从社交节点网络中获取节点交互网络拓扑分布的步骤还包括:
每个用户的威胁系数为其操作过的所有舆情信息的威胁系数平均值,每个舆情信息的威胁系数会随着操作它的用户的威胁系数呈累计变换,设用户为第一节点,舆情信息为第二节点,当用户对某个舆情信息进行操作时将会产生连边,以此循环扩散,最终获取节点网络拓扑分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川无声信息技术有限公司,未经四川无声信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711223777.4/1.html,转载请声明来源钻瓜专利网。