[发明专利]一种服务流程抽取方法在审

专利信息
申请号: 202110623083.X 申请日: 2021-06-04
公开(公告)号: CN113361259A 公开(公告)日: 2021-09-07
发明(设计)人: 曹斌;程钦男;莫志强;范菁 申请(专利权)人: 浙江工业大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06F16/33
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 服务 流程 抽取 方法
【权利要求书】:

1.一种服务流程抽取方法,其特征在于,包括以下步骤:

S1:对数据集中的文档进行数据预处理。

S2:将步骤S1预处理得到的数据基于Bert编码,得到各个词的词向量表示。

S3:基于步骤S2得到的词向量表示,使用单层BILSTM捕获句子中的有效上下文特征。

S4:基于步骤S2得到的词向量表示,使用multi-head attention机制捕获跨句子之间的有效上下文特征。

S5:基于步骤S3和S4得到的上下文特征,使用特征融合层进行特征融合,即融合来自不同粒度的上下文特征。

S6:多任务联合优化,主要包含pairwise局部任务和listwise全局任务。基于pairwise算法得到任意两个事件对的序列关系;在给定文档和事件的条件下,基于listwise算法,模型需要给出与每个事件相对应的等级值,根据事件相对应的等级值得到相应的事件序列关系。之后联合训练pairwise局部任务和listwise全局任务。

S7:使用全局推断模块解决事件对之间无法满足传递性的冲突,训练得到服务流程抽取模型。

2.根据权利要求1所述的服务流程抽取方法,其特征在于,所述的数据预处理方式,包括:对数据集中的事件进行标注,并标注相应的事件id。

3.根据权利要求1所述的服务流程抽取方法,其特征在于,所述的预处理之后的数据基于bert编码得到词向量表示,具体是指:bert模型能够对单词的语义信息进行建模,建模之后可应用于各种下游任务。给定一个文档d,对于文档中的每个字符输入到bert模型中:

其中,表示第i个句子中的第n个字符以及相应的单词经过bert编码后的表示形式。

4.根据权利要求1所述的服务流程抽取方法,其特征在于,所述的使用单层BILSTM捕获句子中的有效上下文特征,具体是指:BILSTM能够捕获句子级别的有效上下文特征,因此在句子上应用了单层BILSTM。基于Bert输出的词向量表示,通过BILSTM层得到句子的特征向量表示:

其中,表示第i个句子中的第n个字符经由BILSTM层得到的特征表示。

5.根据权利要求1所述的服务流程抽取方法,其特征在于,所述的使用multi-headattention机制捕获跨句子之间的有效上下文特征,具体是指:距离是BILSTM特征提取效果的主要限制因素,因此仅使用BILSTM来提取句子中的上下文特征,对于跨句子之间的上下文特征提取,使用了multi-head attention机制,同时定义该层为MHA。基于Bert输出的词向量表示,通过MHA层得到句子的特征向量表示:

其中,表示第i个句子中的第n个字符经由MHA层得到的特征表示。

6.根据权利要求1所述的服务流程抽取方法,其特征在于,所述的使用特征融合层融合来自不同粒度的上下文特征,具体是指:考虑到并非所有特征都对最终的事件序列抽取任务做出同等的贡献,采用门机制来加权不同粒度的上下文信息,定义门机制如下:

其中,g表示门机制的注意力向量,W1和W2是模型需要学习的权重系数,b是模型需要学习的偏差系数。σ表示的是sigmoid激活函数。⊙表示向量中对应元素逐个相乘。表示第i个句子中的第n个字符的特征融合表示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110623083.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top