[发明专利]社交网络事件时序关系分析方法有效
申请号: | 201810946330.8 | 申请日: | 2018-08-20 |
公开(公告)号: | CN109145224B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 费高雷;周磊;胡光岷 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/35 |
代理公司: | 成都虹盛汇泉专利代理有限公司 51268 | 代理人: | 王伟 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社交 网络 事件 时序 关系 分析 方法 | ||
1.一种社交网络事件时序关系分析方法,其特征在于,包括以下步骤:
A、获取事件检测结果数据,所述事件检测结果数据为事件短文本簇集合;
B、根据事件检测结果数据中短文本单词数和短文本数对事件短文本簇集合进行事件短文本簇时间序列抽取;
C、遍历步骤B抽取的事件短文本簇时间序列集合,采用动态时间规整算法获取所有事件短文本簇之间的时序对应关系;
D、根据步骤C获取的事件短文本簇之间的时序对应关系,构建分位数-分位数图;
E、计算事件短文本簇之间的时序对应关系的时序距离,再根据分位数-分位数图获取事件短文本簇之间的时序先后关系,得到所有事件短文本簇之间的时序关系;
计算事件短文本簇之间的时序对应关系的时序距离具体为:
根据两个事件短文本簇时间序列之间的时序对应关系,分别计算事件短文本簇时间序列Ti中每个时间点与事件短文本簇时间序列Tj中时间点进行匹配的时序距离,将所有时间匹配的时序距离进行求和后再求平均,得到两个事件短文本簇时间序列之间的时序对应关系的时序距离;
所述两个事件短文本簇时间序列之间的时序对应关系的时序距离表示为
其中,D(Ti,Tj)表示事件短文本簇时间序列Ti和Tj之间的时序距离,Pl表示第l个时间匹配的时序距离,nr表示第r个时间匹配包含的时间对的个数。
2.如权利要求1所述的社交网络事件时序关系分析方法,其特征在于,所述步骤A中,事件短文本簇集合包括多条短文本,每条短文本包含创建时间、发布数目、以及短文本内容信息。
3.如权利要求2所述的社交网络事件时序关系分析方法,其特征在于,所述步骤B中,根据事件检测结果数据中短文本单词数和短文本数对事件短文本簇集合进行事件短文本簇时间序列抽取,具体为:
设定短文本单词数阈值和短文本数阈值,将事件检测结果数据中短文本单词数小于短文本单词数阈值的短文本、及短文本数小于短文本数阈值的短文本簇进行剔除,抽取得到有效的事件短文本簇时间序列集合。
4.如权利要求3所述的社交网络事件时序关系分析方法,其特征在于,所述步骤C中,遍历步骤B抽取的事件短文本簇时间序列集合,采用动态时间规整算法获取所有事件短文本簇之间的时序对应关系,具体为:
将每个事件短文本簇的文档创建时间序列表示为T={t1,t2,...tN},N为事件的短文本数目,第i个事件短文本簇的文档创建时间序列Ti表示为Ti={ti1,ti2,...tik,...},ik为事件i的第k个文档创建时间序列,选取两个事件短文本簇时间序列Ti={ti1,ti2,...tiN}、Tj={tj1,tj2,...tjM},其中ti1<ti2<...<tiN,tj1<tj2<...<tjM,采用动态时间规整算法对两个事件短文本簇时间序列中的时间点进行匹配,得到两个事件短文本簇之间的时序对应关系,遍历事件短文本簇时间序列集合,得到所有事件短文本簇之间的时序对应关系。
5.如权利要求4所述的社交网络事件时序关系分析方法,其特征在于,所述动态时间规整算法具体包括以下分步骤:
C1、根据两个事件短文本簇时间序列Ti={ti1,ti2,...tiN}、Tj={tj1,tj2,...tjM},构建N×M的二维矩阵,并设置初始化值;
C2、采用绝对值距离作为距离度量方式,计算两个事件短文本簇时间序列之间的最小距离;
C3、根据步骤C2得到的两个事件短文本簇时间序列之间的最小距离及二维矩阵的值,计算两个事件短文本簇时间序列中的时间点之间的最优匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810946330.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于社交影响力传播的社交推荐方法
- 下一篇:一种数据处理方法及装置