[发明专利]事件抽取方法以及电子设备、存储装置在审
申请号: | 202110420855.X | 申请日: | 2021-04-19 |
公开(公告)号: | CN113392213A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 张浩宇;吴飞;王玉杰;方四安;柳林;徐承 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/216;G06F40/284 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 230000 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 抽取 方法 以及 电子设备 存储 装置 | ||
1.一种事件抽取方法,其特征在于,包括:
获取事件文本的事件参数;其中,所述事件参数包括所述事件文本涉及的事件类别和所述事件类别的若干事件属性;
在每轮抽取过程中,选择未选择过的所述事件参数作为当前参数,并构造关于问询所述当前参数的问题文本,以及将所述问题文本和所述事件文本输入事件抽取模型,以抽取得到所述事件文本中与所述当前参数对应的事件词语;其中,所述问题文本包括在本轮抽取之前抽取到的事件词语。
2.根据权利要求1所述的方法,其特征在于,所述构造关于问询所述当前参数的问题文本,包括:
构造多个不同的所述问题文本;
所述将所述问题文本和所述事件文本输入事件抽取模型,以抽取得到所述事件文本中与所述当前参数对应的事件词语,包括:
对于每一所述问题文本,将所述问题文本和所述事件文本输入所述事件抽取模型进行预测,得到预测结果;其中,所述预测结果表示所述事件文本中各个字符属于所述事件词语的可能性;
基于所述多个所述问题文本对应的所述预测结果,得到所述事件词语。
3.根据权利要求2所述的方法,其特征在于,所述预测结果包括所述各个字符属于所述事件词语的初始概率值;所述基于所述多个所述问题文本对应的所述预测结果,得到所述事件词语,包括:
分别将所述各个字符作为当前字符;
对各个所述预测结果中所述当前字符的初始概率值进行加权处理,得到所述当前字符属于所述事件词语的最终概率值;
基于所述各个字符的最终概率值,得到所述事件词语。
4.根据权利要求2所述的方法,其特征在于,所述将所述问题文本和所述事件文本输入所述事件抽取模型进行预测,得到预测结果,包括:
将所述问题文本和所述事件文本输入事件抽取模型的语义提取网络,得到所述各个字符的初始语义表示;
利用所述事件抽取模型的语义融合网络将所述各个字符的初始语义表示分别与所述事件类别的类别语义表示进行融合,得到所述各个字符的最终语义表示;
利用所述事件抽取模型的结果预测网络对所述最终语义表示进行预测,得到所述预测结果。
5.根据权利要求4所述的方法,其特征在于,所述将所述问题文本和所述事件文本输入事件抽取模型的语义提取网络,得到所述各个字符的初始语义表示,包括:
获取所述问题文本和所述事件文本中所述字符的向量表示;其中,所述向量表示至少包括词向量表示和段落向量表示;
将所述事件文本中第一字符和第二字符的向量表示分别进行更新,以区分所述第一字符和所述第二字符;其中,所述第一字符属于已经抽取到的所述事件词语,所述第二字符不属于已经抽取到的所述事件词语;
将所述问题文本和所述事件文本中所述字符的向量表示输入所述语义提取网络,得到所述各个字符的初始语义表示。
6.根据权利要求5所述的方法,其特征在于,所述将所述事件文本中第一字符和第二字符的向量表示分别进行更新,包括:
将所述第一字符的词向量表示与第一向量表示相加,并将所述第二字符的词向量表示与第二向量表示相加,且所述第一向量表示不同于所述第二向量表示;
和/或,将所述第一字符的段落向量表示更新为第三向量表示,并维持所述第二字符的段落向量表示不变,且所述第三向量表示不同于所述第二字符的段落向量表示。
7.根据权利要求1所述的方法,其特征在于,所述当前参数是按照与所述事件类别对应的参数顺序依次选择的,且所述参数顺序中所述事件类别位于首位,所述参数顺序中所述若干事件属性的排序步骤包括:
统计涉及同一所述事件类别的样本事件文本所涉及的各个所述事件属性的占比,并基于所述占比的高低顺序,得到所述事件类别对应的参数顺序中所述若干事件属性的排序;
或者,统计利用预设抽取模型对涉及同一所述事件类别的样本事件文本抽取各个所述事件属性对应的事件词语的准确率,并基于所述准确率的高低顺序,得到所述事件类别对应的参数顺序中所述若干事件属性的排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110420855.X/1.html,转载请声明来源钻瓜专利网。