[发明专利]一种事件抽取判断方法及系统在审
申请号: | 202110612736.4 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113792083A | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 于兴文 | 申请(专利权)人: | 的卢技术有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F40/211;G06F40/295;G06F40/30;G06F16/35 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 李鑫 |
地址: | 210000 江苏省南京市经济*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 抽取 判断 方法 系统 | ||
1.一种事件抽取判断方法,其特征在于,包括以下步骤:
获取自然语料,对所述自然语料进行预处理,以获得目标语料;
基于目标语料,运用算法库分别对其进行事件类型判断,以分别获得多组目标类型结果;
基于所述多组目标类型结果,输出最优类型结果;
基于命名实体识别与模式匹配算法,提取目标语料的目标事件元素,并对目标事件元素进行判别;
基于最优类型结果与目标事件元素的对应关系,输出事件抽取结果。
2.根据权利要求1所述的一种事件抽取判断方法,其特征在于,对所述自然语料进行预处理,以获得目标语料,包括对所述自然语料进行语义纠错、断句处理与生僻字处理。
3.根据权利要求1所述的一种事件抽取判断方法,其特征在于,所述基于目标语料,运用算法库分别对其进行事件类型判断,以分别获得多组目标类型结果,所述算法库至少包括文本分类算法、文本匹配算法与触发词匹配算法,其中;
文本分类算法对目标语料进行事件类型分类;
文本匹配算法通过构建样本向量库,所述样本向量库是通过收集样本语料数据,收集样本语料数据中的强意图信息构建的,所述文本匹配算法通过对目标语料进行向量化,收集其中目标强意图信息语料,与向量库中的向量秋菊距离,进行事件类型分类;
触发词匹配算法通过触发词与触发模式,进行事件类型分类。
4.根据权利要求1所述的一种事件抽取判断方法,其特征在于,所述基于命名实体识别与模式匹配算法,提取目标语料的目标事件元素,其中,将基于所述命名实体识别的识别结果,输入所述模式匹配算法的模板字典进行修正与过滤。
5.一种事件抽取判断系统,其特征在于,包括数据预处理模块、事件类型判断模块、事件元素抽取模块与事件输出模块;
所述数据预处理模块配置为,获取自然语料,对所述自然语料进行预处理,以获得目标语料;
所述事件类型判断模块配置为,基于目标语料,运用算法库分别对其进行事件类型判断,以分别获得多组目标类型结果,并基于所述多组目标类型结果,输出最优类型结果;
所述事件元素抽取模块配置为,基于命名实体识别与模式匹配算法,提取目标语料的目标事件元素,并对目标事件元素进行判别;
所述事件输出模块配置为,基于最优类型结果与目标事件元素的对应关系,输出事件抽取结果。
6.根据权利要求5所述的一种事件抽取判断系统,其特征在于,还包括数据采集模块,所述数据采集模块配置为,通过麦克风或键盘输入收集自然语料,并将所述自然语料发送给所述数据预处理模块。
7.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至4任一项中所述的方法。
8.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至4任一项中所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于的卢技术有限公司,未经的卢技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110612736.4/1.html,转载请声明来源钻瓜专利网。