[发明专利]基于融合因果干预的文献Related Work自动生成方法在审
申请号: | 202211496491.4 | 申请日: | 2022-11-24 |
公开(公告)号: | CN115827853A | 公开(公告)日: | 2023-03-21 |
发明(设计)人: | 施重阳;刘家昌;劳安;张奇 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06N3/0455;G06N3/084 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王松 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 融合 因果 干预 文献 related work 自动 生成 方法 | ||
1.基于融合因果干预的文献Related Work自动生成方法,其特征在于,包括以下步骤:
步骤1:对related work生成过程中的因果关系进行建模;
对related work生成中的三个要素:句子顺序、文本关系、过渡内容三者之间的因果关系进行建模,并将句子顺序视为混淆因子,其通过文本关系建立起与过渡内容之间的伪相关关系;其中,句子顺序、文档关系分别独立地对过渡内容的生成起到指导作用;
其中,句子顺序、文档关系分别独立地对过渡内容的生成起到指导作用,文档关系和过渡内容之间的关系,指导文本对不同研究之间的关系进行对比;
步骤2:基于因果关系建模结果使用do算子推导干预过程;
步骤3:设计因果干预模块,实现具体干预过程,具体如下:
步骤3.1:在因果干预模块中,首先进行原始干预,根据do算子的推导结果将句子顺序信息融合到文档关系指导过渡内容生成的过程中,初步消除由句子顺序引起的伪相关关系的负面影响;
步骤3.2:通过上下文感知重映射过程对干预后的表征进行重新计算,在此过程中,对其上下文信息进行捕捉和融合,使最终表征分布更为平滑且包含上下文信息;
步骤3.3:通过最优力度学习过程,学习既有的原始、干预和重映射这三种表征各自对应的输出强度,通过融合这三种强度,得到最优的干预力度,计算输出最终表征;
步骤4:将因果干预模块与Transformer模型相融合,得到最终端到端的具有因果干预能力的related work生成模型;
步骤5:经因果干预生成related work;
将Transformer解码器的最终输出经线性层和softmax层后,获取到每个位置具体的单词内容;
步骤6:训练神经网络,使用交叉熵作为损失函数,计算损失值,实现自行生成高质量的文献related work内容;
在设定的训练轮数内,使用交叉熵计算预测生成的related work和真实related work之间的差距损失,并通过反向传播优化调整模型参数,最终使得模型表现达到最优。
2.如权利要求1所述的基于融合因果干预的文献Related Work自动生成方法,其特征在于,步骤2中,基于步骤1构建好的因果图,使用do算子进行因果干预过程的推导如下:
P(y|do(x))=∑cP(y|do(x),c)P(c|do(x))
=∑cP(y|x,c)P(c|do(x))
=∑cP(y|x,c)P(c)
其中,P(y|do(x))表示基于干预后的x推导y,c为句子顺序,x为文档关系,y为过渡内容;通过do算子的推导,因果图中的路径c→x被切断,使伪相关关系的影响被削弱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211496491.4/1.html,转载请声明来源钻瓜专利网。