[发明专利]中文事件的抽取方法、装置、设备及存储介质在审
申请号: | 202010311727.7 | 申请日: | 2020-04-20 |
公开(公告)号: | CN111522915A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 许诺;赵东岩;谢海华 | 申请(专利权)人: | 北大方正集团有限公司;北大方正信息产业集团有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 罗英;刘芳 |
地址: | 100871 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 事件 抽取 方法 装置 设备 存储 介质 | ||
1.一种中文事件的抽取方法,其特征在于,所述方法包括:
获取中文事件描述;
将所述中文事件描述输入预先训练好的事件联合抽取模型,得到所述中文事件描述中每个中文事件的事件三元组,所述中文事件的事件三元组包括所述中文事件的触发词、事件要素和事件要素角色。
2.根据权利要求1所述的方法,其特征在于,所述将所述中文事件描述输入预先训练好的事件联合抽取模型,得到所述中文事件描述中每个中文事件的事件三元组,包括:
将所述中文事件描述输入所述事件联合抽取模型,在所述事件联合抽取模型中对所述中文事件描述进行编码,获得事件初始编码;
在所述事件联合抽取模型中,在每个预设的事件类型上对所述事件初始编码进行触发词识别,得到所述触发词;
在所述事件联合抽取模型中,根据所述触发词对所述事件初始编码进行更新,得到所述触发词对应的事件更新编码;
在所述事件联合抽取模型中,在每个预设的角色类型上对所述触发词对应的事件更新编码进行事件要素识别,得到所述触发词对应的扮演相应事件要素角色的所述事件要素,由所述触发词、所述事件要素和所述事件要素角色构成所述中文事件的事件三元组。
3.根据权利要求2所述的方法,其特征在于,所述事件初始编码包括所述中文事件描述中每个字符的编码序列,所述预先训练好的事件联合抽取模型的参数包括预先训练好的触发词首尾识别参数;所述在每个预设的事件类型上对所述事件初始编码进行触发词识别,包括:
在所述每个预设的事件类型上,根据所述每个字符的编码序列和所述触发词首尾识别参数,对所述每个字符进行触发词首尾识别,得到所述触发词的词首字符和词尾字符。
4.根据权利要求3所述的方法,其特征在于,所述对所述每个字符进行触发词首尾识别,包括:
通过预设的激活函数、所述触发词首尾识别参数和所述每个字符的编码序列,对所述每个字符进行触发词首尾识别。
5.根据权利要求3所述的方法,其特征在于,所述根据所述触发词对所述事件初始编码进行更新,包括:
根据所述词首字符的编码序列和所述词尾字符的编码序列,确定所述触发词的编码序列;
根据所述触发词的编码序列,对所述事件初始编码进行更新,得到所述触发词对应的事件更新编码。
6.根据权利要求3所述的方法,其特征在于,所述预先训练好的事件联合抽取模型的参数还包括预先训练好的事件要素首尾识别参数;所述在每个预设的角色类型上对所述触发词对应的事件更新编码进行事件要素识别,包括:
在所述每个预设的角色类型上,根据所述触发词对应的事件更新编码中每个字符的编码序列和所述事件要素首尾识别参数,对所述每个字符进行事件要素首尾识别,得到所述事件要素的词首字符和词尾字符。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
通过预设的交叉熵损失函数构建目标函数,通过对所述目标函数进行优化,得到训练好的所述触发词首尾识别参数和所述事件要素首尾识别参数;
根据训练好的所述触发词首尾识别参数和所述事件要素首尾识别参数,得到训练好的所述事件联合抽取模型。
8.一种中文事件的抽取装置,其特征在于,所述装置包括:
获取模块,用于获取中文事件描述;以及
处理模块,用于将所述中文事件描述输入预先训练好的事件联合抽取模型,得到所述中文事件描述中每个中文事件的事件三元组,所述中文事件的事件三元组包括所述中文事件的触发词、事件要素和事件要素角色。
9.一种电子设备,其特征在于,所述设备包括:
处理器,存储器,以及存储在所述存储器上并可在所述处理器上运行的计算机程序;
其中,所述处理器运行所述计算机程序时实现如权利要求1至7中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北大方正信息产业集团有限公司,未经北大方正集团有限公司;北大方正信息产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010311727.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示面板及其制作方法
- 下一篇:微孔雾化片加工方法