[发明专利]一种服务流程抽取方法在审

专利信息
申请号: 202110623083.X 申请日: 2021-06-04
公开(公告)号: CN113361259A 公开(公告)日: 2021-09-07
发明(设计)人: 曹斌;程钦男;莫志强;范菁 申请(专利权)人: 浙江工业大学
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06F16/33
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 邱启旺
地址: 310014 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 服务 流程 抽取 方法
【说明书】:

发明公开了一种服务流程抽取方法,首先用Bert进行语义编码得到词向量表示,然后通过BILSTM获取句子中的上下文特征,同时通过multi‑head attention机制获取跨句子之间的特征,即从不同的粒度对信息进行编码,之后通过门机制融合句子中和跨句子之间的特征,获得文档中丰富的上下文语义编码信息,然后通过多任务优化从局部和全局角度学习事件之间的顺序关系最终得到有序事件序列。本发明能够在文档级别上实现有序事件的提取,从不同的粒度即句子中和跨句子之间获取丰富的上下文语义编码信息,最后通过局部事件对排序任务以及全局任务对事件进行打分并排序得到有序事件序列。

技术领域

本发明属于服务流程管理和自然语言处理交叉领域,尤其涉及一种服务流程抽取方法。

背景技术

在服务流程管理领域,服务流程是指为满足客户服务需求,将两个以上具有相互联系和相互作用的相关流程节点进行有序排列组合成具有特定结构和服务功能的有机整体。服务流程在现实世界中有多种存在形式,最为常见的是文本描述形式,如何从文本描述中有效挖掘潜在的服务流程具有十分重要的意义。

然而,在实际操作中进行服务流程内部的事件序列抽取并不是一件容易的事情,因为与事件序列提取相关文献中的大多数工作都假定事件发生的顺序与文本描述的顺序是一致的:从文本抽取到了事件,并且将抽取到的事件按文本的描述顺序进行排列就认为得到了事件序列。然而当文本是非过程文本时,这种假设是有问题的,也就是指在非过程文本中,文本描述的事件顺序并不是事件真实发生的顺序,因为当某个过程或者事件比较重要时,作者会将其优先描述以起到强调的作用。常见的,在语文中存在一种“倒叙”的写作手法,先描述事件的结局再描述整个事件的过程,显而易见,在“倒叙”的写作手法下,文本描述的事件顺序并不是事件真实发生的顺序。同时,有序事件序列提取又是一项非常困难的任务,因为判断事件的顺序需要充分考虑文章的上下文来收集有用的信息。

发明内容

本发明的目的在于针对现有技术的不足,提供一种服务流程抽取方法。

本发明的目的是通过以下技术方案来实现的:一种服务流程抽取方法,包括以下步骤:

S1:对数据集中的文档进行数据预处理。

S2:将步骤S1预处理得到的数据基于Bert编码,得到各个词的词向量表示。

S3:基于步骤S2得到的词向量表示,使用单层BILSTM捕获句子中的有效上下文特征。

S4:基于步骤S2得到的词向量表示,使用multi-head attention机制捕获跨句子之间的有效上下文特征。

S5:基于步骤S3和S4得到的上下文特征,使用特征融合层进行特征融合,即融合来自不同粒度的上下文特征。

S6:多任务联合优化,主要包含pairwise局部任务和listwise全局任务。基于pairwise算法得到任意两个事件对的序列关系;在给定文档和事件的条件下,基于listwise算法,模型需要给出与每个事件相对应的等级值,根据事件相对应的等级值得到相应的事件序列关系。之后联合训练pairwise局部任务和listwise全局任务。

S7:使用全局推断模块解决事件对之间无法满足传递性的冲突,训练得到服务流程抽取模型。

进一步地,所述的数据预处理方式,包括:对数据集中的事件进行标注,并标注相应的事件id。

进一步地,所述的预处理之后的数据基于bert编码得到词向量表示,具体是指:bert模型能够对单词的语义信息进行建模,建模之后可应用于各种下游任务。给定一个文档d,对于文档中的每个字符输入到bert模型中:

其中,表示第i个句子中的第n个字符以及相应的单词经过bert编码后的表示形式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110623083.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top