[发明专利]事件分级方法、装置、设备和介质在审
申请号: | 201910536816.9 | 申请日: | 2019-06-20 |
公开(公告)号: | CN110263254A | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 雷伟俊;陈玉光;罗雨;潘禄;陈伟娜;韩翠云 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件分级 事件属性 互联网信息 高效分级 事件活动 事件级别 事件实体 分级 资讯 热门 | ||
1.一种事件分级方法,其特征在于,包括:
识别资讯流中的事件;
提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;
基于所述事件属性对所述事件进行分级。
2.根据权利要求1所述的方法,其特征在于,所述基于所述事件属性对所述事件进行分级,包括:
根据所述事件实体的查看信息、所述事件活动的查看信息、所述事件与热门活动的相关度、所述事件中的热门实体信息、所述事件领域的热度信息、所述事件的关注度信息和所述事件的传播性信息中的至少一种,确定所述事件的等级。
3.根据权利要求2所述的方法,其特征在于,所述确定所述事件的等级之前,所述方法还包括:
根据所述事件实体与热门活动的共现信息,和/或所述事件活动与热门活动的共现信息,确定所述事件与热门活动的相关度信息;
根据所述事件所属事件簇中的事件数量,确定所述事件的关注度信息;
根据所述事件簇中事件的发布者属性信息,确定所述事件的传播性信息。
4.根据权利要求1所述的方法,其特征在于,所述提取所述事件的事件实体,包括:
对所述事件的文本进行切词,生成事件词语;
基于句法结构从所述事件词语中确定候选实体;
将所述候选实体与所述事件所属领域的实体进行匹配;
若匹配一致,则将所述候选实体作为所述事件的事件实体。
5.根据权利要求1所述的方法,其特征在于,所述提取所述事件的事件簇信息,包括:
基于事件内容,对从资讯流中识别到的至少两个事件进行聚类,生成事件簇;
统计所述事件簇中事件的数量;
将所述事件簇中事件的数量和/或所述事件簇中事件的发布者属性信息,作为所述事件的事件簇信息。
6.根据权利要求1所述的方法,其特征在于,所述基于所述事件属性对所述事件进行分级之后,所述方法还包括:
根据所述事件的等级,从所述事件中确定待推送事件,并对所述待推送事件进行推送。
7.根据权利要求1所述的方法,其特征在于,所述识别资讯流中的事件之后,所述方法还包括:
对所述事件的文本进行句子切分;
将经过切分的句子作为候选事件名;
基于事件名特征,从所述候选事件名中确定目标事件名。
8.一种事件分级装置,其特征在于,包括:
事件识别模块,用于识别资讯流中的事件;
属性提取模块,用于提取所述事件的事件属性,其中所述事件属性包括:事件实体、事件活动、事件领域和事件簇信息中的至少一种;
事件分级模块,用于基于所述事件属性对所述事件进行分级。
9.根据权利要求8所述的装置,其特征在于,所述事件分级模块,包括:
事件分级单元,用于根据所述事件实体的查看信息、所述事件活动的查看信息、所述事件与热门活动的相关度、所述事件中的热门实体信息、所述事件领域的热度信息、所述事件的关注度信息和所述事件的传播性信息中的至少一种,确定所述事件的等级。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
相关度确定模块,用于确定所述事件的等级之前,根据所述事件实体与热门活动的共现信息,和/或所述事件活动与热门活动的共现信息,确定所述事件与热门活动的相关度信息;
关注度确定模块,用于根据所述事件所属事件簇中的事件数量,确定所述事件的关注度信息;
传播性确定模块,用于根据所述事件簇中事件的发布者属性信息,确定所述事件的传播性信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910536816.9/1.html,转载请声明来源钻瓜专利网。