[发明专利]一种事件时间轴挖掘方法与系统有效
申请号: | 201711449439.2 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108062402B | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 晋彤;张中弦 | 申请(专利权)人: | 云润大数据服务有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F40/211 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 时间 挖掘 方法 系统 | ||
本发明公开了一种事件时间轴挖掘方法与系统,所述事件时间轴挖掘方法包括:采集目标事件的事件信息;对所述事件信息进行实体识别,抽取所述目标事件的实体;对所述事件信息进行语义分析,挖掘所述目标事件的事件元素;对所述事件信息进统计分析,挖掘所述目标事件的重要节点;对所述事件信息进统计分析,挖掘所述目标事件的发展阶段;根据所述实体、所述事件元素、所述重要节点以及所述发展阶段,形成所述目标事件的事件时间轴。通过所述事件时间轴挖掘方法,能够从多个维度分析所述目标事件的发展,全面反映事件的发展过程,方便监测者监测事件的发展情况。
技术领域
本发明涉及自然语言处理技术领域,具体涉及一种事件时间轴挖掘方法与系统。
背景技术
事件(Event)是信息表示的一种主要形式,它是一种特定人、物、事在特定时间和特定地点相互作用的客观事实(也称“自然事件”),如人的受伤、死亡事件和食品的添加剂事件等。事件是客观事实诉诸文字的独特语用形式,而一篇文章一般由围绕某个话题或者相关主题的各种事件组成,这些事件表达了文章的核心内容。因而文本中的事件往往不是孤立个体,其发生与发展往往与外在的围绕同一话题的其他事件有着一定的关系,如“时序”关系。事件的时序关系是一种重要的事件关系,它连接了某一话题下事件从开始到结束的演变过程以及事件的相互关系,近年来成为信息抽取研究的一个热点。
目前,现有的事件时序分析中分析事件的元素相对单一,比如只分析事件发展过程的重要观点,造成事件时序分析结果较为单一、片面,不能够很好反映事件本身发生、发展和衰减的过程,以及事件在发生、发展和衰减的过程中出现的重要节点。
发明内容
本发明的目的是提供一种事件时间轴挖掘方法与系统,能够从多个维度分析事件的发展,全面反映事件的发展过程,方便监测者监测事件的发展情况。
为解决以上技术问题,本发明实施例提供一种事件时间轴挖掘方法,包括:
采集目标事件的事件信息;
对所述事件信息进行实体识别,抽取所述目标事件的实体;
对所述事件信息进行语义分析,挖掘所述目标事件的事件元素;
对所述事件信息进统计分析,挖掘所述目标事件的重要节点;
对所述事件信息进统计分析,挖掘所述目标事件的发展阶段;
根据所述实体、所述事件元素、所述重要节点以及所述发展阶段,形成所述目标事件的事件时间轴。
优选地,所述事件时间轴挖掘方法还包括:
根据所述实体、所述事件元素、所述重要节点以及所述发展阶段,预测所述目标事件下的网民情绪以及线下活动。
优选地,所述对所述事件信息进行实体识别,抽取所述目标事件的实体,具体包括:
从所述事件信息中查找与收录在预设实体词典中的实体词相匹配的明显实体;
对所述事件信息进行CRF句法分析,挖掘所述目标事件的模糊实体;
整合所述明显实体和所述模糊实体,形成所述目标事件的实体。
优选地,所述对所述事件信息进行CRF句法分析,挖掘所述目标事件的模糊实体,具体包括:
对所述事件信息进行分词处理,形成训练语料集;
根据所述训练语料集,训练预设的CRF模型;
根据所述预设的CRF模型,预测所述模糊实体。
优选地,所述目标事件的事件元素包括所述目标事件发生的时间,地点以及相关人物。
优选地,所述对所述事件信息进统计分析,挖掘所述目标事件的重要节点,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云润大数据服务有限公司,未经云润大数据服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711449439.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种肉鸽高效育肥养殖方法
- 下一篇:自动化切割装置