[发明专利]兴趣点的事件挖掘方法及其装置在审

专利信息
申请号: 201811522521.8 申请日: 2018-12-13
公开(公告)号: CN109710710A 公开(公告)日: 2019-05-03
发明(设计)人: 陈文浩;郑宇宏;周辉;陈玉光 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06F16/29 分类号: G06F16/29;G06F16/9535;G06N3/04
代理公司: 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人: 宋合成
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 兴趣点 资讯信息 事件挖掘 预设事件 准确率 集合 筛选 抓取 挖掘
【权利要求书】:

1.一种兴趣点的事件挖掘方法,其特征在于,包括:

获取多个资讯信息;

根据预设事件动词集合对所述多个资讯信息进行筛选,其中,所述预设事件动词集合中包括多个事件动词;

从筛选之后的资讯信息中提取兴趣点事件句;以及

从所述兴趣点事件句中提取兴趣点及所述兴趣点对应的事件。

2.如权利要求1所述的兴趣点的事件挖掘方法,其特征在于,所述根据预设事件动词集合对所述多个资讯信息进行筛选,包括:

判断所述资讯信息中是否包括预设城市名称;

如果包括所述预设城市名称,则进一步判断所述资讯信息中是否包括所述预设事件动词集合中的至少一个事件动词;

如果未包括所述预设城市名称,或未包括所述预设事件动词集合中的至少一个事件动词,则将所述资讯信息筛除。

3.如权利要求1或2所述的兴趣点的事件挖掘方法,其特征在于,所述预设事件动词集合中的事件动词通过临近词扩展获得。

4.如权利要求1所述的兴趣点的事件挖掘方法,其特征在于,所述从筛选之后的资讯信息中提取兴趣点事件句,包括:

将所述筛选之后的资讯信息切分成多个句子;

对所述多个句子分别进行识别以判断所述句子是否为兴趣点事件变迁句;以及

如果判断为所述兴趣点事件变迁句,则将所述句子作为所述兴趣点事件句。

5.如权利要求4所述的兴趣点的事件挖掘方法,其特征在于,如果同时满足以下条件,则判断所述句子为所述兴趣点事件变迁句:

所述句子包括组织机构类别的专名数据;

所述句子包括兴趣点事件预设动词;且

所述句子包括依存句式。

6.如权利要求1所述的兴趣点的事件挖掘方法,其特征在于,所述从所述兴趣点事件句中提取兴趣点及所述兴趣点对应的事件,包括:

通过兴趣点专名抽取模型从所述兴趣点事件句中提取所述兴趣点;

从所述兴趣点事件句中提取所述兴趣点对应的事件,以及所述事件对应的相关时间;

根据所述事件对应的相关时间生成所述事件的生效时间;

根据所述生效时间修改地图中所述兴趣点的事件。

7.如权利要求6所述的兴趣点的事件挖掘方法,其特征在于,所述兴趣点专名抽取模型通过以下步骤训练获得:

获取检索词历史数据,其中,所述检索词历史数据包括多个检索词;

获取所述检索词历史数据中每个检索词对应的关联兴趣点;

获取兴趣点-新闻句子对历史集合,其中,所述兴趣点-新闻句子对历史集合中包括多个兴趣点-新闻句子对;

使用长短期记忆网络对所述兴趣点-新闻句子对中的新闻句子进行序列标注,以获取所述新闻句子的序列标注结果;

使用条件随机场对所述新闻句子的序列标注结果进行修正;

对所述兴趣点-新闻句子对中的兴趣点进行序列标注,并根据所述兴趣点和所述新闻句子的序列标注结果,训练所述长短期记忆网络和所述条件随机场。

8.一种兴趣点的事件挖掘装置,其特征在于,所述装置包括:

获取模块,用于获取多个资讯信息;

筛选模块,用于根据预设事件动词集合对所述多个资讯信息进行筛选,其中,所述预设事件动词集合中包括多个事件动词;

第一提取模块,用于从筛选之后的资讯信息中提取兴趣点事件句;以及

第二提取模块,用于从所述兴趣点事件句中提取兴趣点及所述兴趣点对应的事件。

9.如权利要求8所述的兴趣点的事件挖掘装置,其特征在于,所述筛选模块,包括:

第一判断单元,用于判断所述资讯信息中是否包括预设城市名称;

第二判断单元,用于当所述第一判断单元确定包括所述预设城市名称时,进一步判断所述资讯信息中是否包括所述预设事件动词集合中的至少一个事件动词;

筛除单元,用于当所述第一判断单元确定未包括所述预设城市名称,或所述第二判断单元确定未包括所述预设事件动词集合中的至少一个事件动词时,将所述资讯信息筛除。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811522521.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top