[发明专利]一种事件类型识别方法及装置有效
申请号: | 202010647610.6 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111767730B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 刘志煌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30;G06F16/35;G06F16/2458 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 彭绪坤 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 类型 识别 方法 装置 | ||
本发明公开了一种事件类型识别方法及装置;获取预设事件类型对应的事件类型词集合,其中,一个事件类型词集合中包括同一事件类型对应的事件类型词;确定事件类型词集合中与待识别事件内容匹配的事件类型词,并将匹配的事件类型词对应的预设事件类型,确定为待识别事件内容的暂定事件类型;获取暂定事件类型对应的频繁字序列,频繁字序列包括从暂定事件类型对应的多个事件内容样本中挖掘出的频繁字;确定待识别事件内容中包含的词,与频繁字序列的相似度;基于相似度,确定待识别事件内容的实际事件类型是否为暂定事件类型。该方案可以提高事件类型识别的准确率。
技术领域
本申请涉及通信技术领域,具体涉及一种事件类型识别方法及装置。
背景技术
近年来随着信息技术的飞速发展,网络逐步成为一个巨大的数据源,该数据源包含了众多有价值的信息,可以通过对这些信息进行各事件类型识别,确定其所属事件类型,事件类型识别可以广泛地应用于新闻资讯、论坛文章、政策解读等领域。
在对相关技术的研究和实践过程中,本申请的发明人发现目前事件类型识别方法主要是基于预设事件触发词的事件类型识别方法,仅仅依据触发词就判定一个语句是否为某类时间容易出错,例如有些包含触发词的语句,实际上并未表述相关事件,或者一些词语在多个事件类型中都可以作为触发词,所以相关技术中基于触发词进行的事件类型识别的准确率较低。
发明内容
本申请实施例提供一种事件类型识别方法及装置,可以结合事件类型对应的事件类型词,以及事件类型对应的事件内容样本中出现的频繁字,进行事件类型识别,提高事件类型识别的准确率。
本申请实施例提供了一种事件类型识别方法,包括:
获取预设事件类型对应的事件类型词集合,其中,一个事件类型词集合中包括同一事件类型对应的事件类型词;
确定所述事件类型词集合中与所述待识别事件内容匹配的事件类型词,并将所述匹配的事件类型词对应的预设事件类型,确定为所述待识别事件内容的暂定事件类型;
获取所述暂定事件类型对应的频繁字序列,所述频繁字序列包括从所述暂定事件类型对应的多个事件内容样本中挖掘出的频繁字;
确定所述待识别事件内容中包含的词,与所述频繁字序列的相似度;
基于所述相似度,确定所述待识别事件内容的实际事件类型是否为所述暂定事件类型。
相应的,本申请实施例提供了一种事件类型识别装置,包括:
第一获取单元,用于获取预设事件类型对应的事件类型词集合,其中,一个事件类型词集合中包括同一事件类型对应的事件类型词;
匹配单元,用于确定所述事件类型词集合中与所述待识别事件内容匹配的事件类型词,并将所述匹配的事件类型词对应的预设事件类型,确定为所述待识别事件内容的暂定事件类型;
第二获取单元,用于获取所述暂定事件类型对应的频繁字序列,所述频繁字序列包括从所述暂定事件类型对应的多个事件内容样本中挖掘出的频繁字;
第一确定单元,用于确定所述待识别事件内容中包含的词,与所述频繁字序列的相似度;
第二确定单元,用于基于所述相似度,确定所述待识别事件内容的实际事件类型是否为所述暂定事件类型。
在一实施例中,第一获取单元,包括:
分词子单元,用于对预设事件类型对应的事件名称进行分词处理,得到至少一个原始事件类型词;
第一获取子单元,用于获取与所述原始事件类型词语义关联的扩展事件类型词,将同一原始事件类型词和对应的扩展事件类型词加入对应的语义关联词集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010647610.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:建筑工地用高效泥水分离结构及其施工方法
- 下一篇:一种农业种植用番茄运输装置