[发明专利]事件追踪与变化阶段划分方法、系统及相关设备在审
申请号: | 201811014739.2 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109325524A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 曾大军;郑晓龙;何赛克;张曈;王乾宇 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库;陈晓鹏 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及机器学习领域,具体涉及一种事件追踪与变化阶段划分方法、系统及相关设备,旨在提高计算效率。本发明的方法包括:从多个不同的新闻传播通道中采集新闻数据并存入数据库中;然后进行话题聚类,选择待追踪事件对应的新闻集合,并查找出待追踪事件的起始发布时间;以起始发布时间为起点,绘制待追踪事件在单位时间内的信息量随时间变化的曲线,再进行等时间间隔采样,绘制出平滑后的演化包络线;求出极大值点的个数,进而计算出变化阶段的个数;计算出极大值点和极小值点;在每个极大值点的前后,分别根据预设的信息量百分比选择分割点,从而划分出不同的变化阶段。本发明提升了算法的效率,降低了时间复杂度、阈值依赖和形状依赖。 | ||
搜索关键词: | 变化阶段 极大值点 事件追踪 追踪 信息量 绘制 机器学习领域 等时间间隔 时间复杂度 随时间变化 计算效率 新闻传播 新闻数据 包络线 分割点 采样 平滑 聚类 算法 预设 发布 数据库 集合 采集 查找 话题 | ||
【主权项】:
1.一种事件追踪与变化阶段划分方法,其特征在于,包括以下步骤:从多个不同的新闻传播通道中采集新闻数据并存入数据库中;对所述数据库中的所述新闻数据进行话题聚类,根据不同话题生成相应新闻集合,进而选择待追踪事件对应的新闻集合,并查找出所述待追踪事件的起始发布时间;以所述起始发布时间为起点,根据所述数据库中的新闻数据绘制所述待追踪事件在单位时间内的信息量随时间变化的曲线;在所述曲线上进行等时间间隔采样,绘制出平滑后的演化包络线;求出所述演化包络线上的极大值点的个数,进而计算出变化阶段的个数;在所述演化包络线上,分别将每个变化阶段等间隔地划分为预设数量的时间段,并计算每个时间段中产生的信息量,进而计算出极大值点和极小值点;在所述演化包络线上每个极大值点的前后,分别根据预设的信息量百分比选择分割点,从而划分出不同的变化阶段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811014739.2/,转载请声明来源钻瓜专利网。