[发明专利]一种目标群体活动事件的演化路径及发展进程分析方法有效
申请号: | 202110388525.7 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113065781B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 郭婉;李亚钊;李彭伟;戴大伟;冯燕来;陆君之;欧阳慈 | 申请(专利权)人: | 中国电子科技集团公司第二十八研究所 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/26;G06F40/216;G06F40/284;G06F40/289 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 黄振华 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 群体 活动 事件 演化 路径 发展 进程 分析 方法 | ||
1.一种目标群体活动事件的演化路径及发展进程分析方法,其特征在于,包括如下步骤:
步骤1、抽取目标活动事件描述文本集中的时间及地理位置特征信息,形成文档和时空特征集;对目标活动事件描述文本集进行分词,构建目标活动事件描述文本集对应的词频矩阵;
步骤2、对目标活动事件描述文本集按时序进行排列,对排序后的文本集按照最小时间粒度的整数倍进行分割,生成时间片划分方案;
步骤3、分别计算、提取按照时间片划分方案分割后的各时间片内文本子集所蕴含的活动主题,计算各时间片中活动主题间的相对熵,对目标群活动事件进行关键时间点分析,并据此形成活动事件的演化路径;
步骤4、对活动事件的演化路径进行可视化展现,生成事件发展脉络图。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:
将目标活动事件描述文本集记为集合D={d1,d2,...dn},其中n∈N*且n>1,N*表示自然数;dn表示集合D中第n个文本;
对集合D中的每个文本di,进行时间及地理位置两类原子信息元素抽取计算,记di中抽取的时间集合为Ti,获取T1,T2,...,Tn中的最大时间和最小时间,分别记为tmax和tmin;记di中抽取的地理位置集合为Pi,将最终生成的文本di的文档和时空特征集记为Di-TP,则Di-TP={Ti,Pi},其中i取值为1~n;
遍历目标活动事件描述文本集,对每一个文档di进行中文分词,分词后过滤掉停用词,最终得到文本集D对应的词频矩阵Df。
3.根据权利要求2所述的方法,其特征在于,步骤2包括如下步骤:
步骤2-1:依据文档和时空特征集Di-TP中的时间集Ti对目标活动事件描述文本集按时序进行排列,待分割时间轴总的开始时间为tmin,结束时间为tmax;
步骤2-2:对排序后的目标活动事件描述文本集按照最小时间粒度的整数倍进行两轮以上分割,设定在分割过程中取分割的时间长度为L且L为最小时间粒度的整数倍,则初步划分的时间片有个,设定空间特征共现频率调整阈值为θ,对每一个时间片进行如下两步操作:
第一步,根据相邻时间片之间文本集的空间特征共现频率对时间划分方案进行第一次调整,对于第i个时间片Si,分别计算Si与Si-1和Si+1两个时间片中文本集的空间特征共现频率,分别记为fi-1和fi+1,如果fi-1>fi+1>θ,则Si与Si-1和Si+1之间的时间片划分方案由Si向前合并;如果θ<fi-1<fi+1,则Si与Si-1和Si+1之间的时间片划分方案由Si向后合并;
第二步,根据当前时间片内文本集的空间特征共现频率对时间划分方案进行第二次调整,计算第i个时间片Si中文本之间的最大空间特征共现频率f′i;如果f′i≥θ,则对时间片Si以最大空间特征文本集为界线进行分割;如果f′i<θ,则不进行时间片划分方案调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第二十八研究所,未经中国电子科技集团公司第二十八研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110388525.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自加压的水泥浆液泵送管系统
- 下一篇:一种多层保温混凝土搅拌筒
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理