[发明专利]一种基于规则嵌入的文本推断方法及装置有效
申请号: | 202110984877.9 | 申请日: | 2021-08-26 |
公开(公告)号: | CN113435212B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 孙宇清;郑威 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/08;G06N5/04 |
代理公司: | 济南竹森知识产权代理事务所(普通合伙) 37270 | 代理人: | 吕利敏 |
地址: | 250013 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 规则 嵌入 文本 推断 方法 装置 | ||
1.一种基于规则嵌入的文本推断方法,其特征在于,该方法包括:
1)将描述用户需求的关键词逻辑表达式转化为等价的析取范式,用户需求是一条命题公式P,则P的析取范式为:
(1)
在公式(1)中,表示合取规则的数量,
2)判定一个输入文本是否满足用户规则:
利用语义逻辑网络依次对输入文本
所述一种基于规则嵌入的文本推断方法还包括,一路与所述语义逻辑网络平行设置的神经分类网络,所述神经分类网络用于:对输入文本进行类别预测,获得输入文本符合用户需求的概率,即预测结果;
对所述输入文本分别通过神经分类网络及语义逻辑网络分别进行推断,分别得到两者的预测结果;最后利用Jensen-Shannon散度,简称JS距离,约束两者预测结果的一致性;
所述依次对输入文本
2-1)项检测
项检测用于判定输入文本是否包含析取范式中项相关的语义;
输入为输入文本;
输出为检测结果记为,表示输入文本包含项的概率;
将输入文本转化为对应的预训练词向量构成的矩阵:记为
,其中代表实数域,
将项转化为向量形式:项的向量为对应关键词集合中,所有关键词对应的预训练词向量的均值,即,其中是集合中的关键词,是对应预训练词向量;
将向量与输入文本的预训练词嵌入矩阵通过矩阵乘法计算得到交互向量,记为:
(2)
对输入文本通过编码网络ENC进行语义编码后得到文本语义向量;
将文本语义向量与交互向量拼接,并经过多层感知机网络MLP进行降维,获得向量,即为输入文本对项
(3)
经过函数激活的值作为检测到输入文本包含项的概率,即推断结果,该概率表示输入文本对项对应关键词集合语义的满足程度:
(4)
是语义逻辑网络预测输入文本
使用交叉熵损失函数来评估推断结果与真实结果分布之间的差异性,求得损失:
(5)
其中,是项的真实标签,通过文本与关键词的字符串匹配检测和同义词扩充的方式获得;表示训练集合样本期望;
2-2)合取规则检测
合取规则检测用于验证输入文本是否满足合取规则的语义;
输入为:步骤2-1)的项表示向量;
输出为:预测输入文本包含合取规则的概率;
合取规则嵌入网络,合取规则包含的项构成序列,其对应项检测获得的项的表示向量构成序列,将序列中所有向量拼接作为输入,经过获得合取规则的表示向量:
(6)
其中,表示的所有项构成的序列;
经过函数激活得到合取规则的检测概率,公式(7)所示,其中表示激活函数,是网络参数,是输入文本包含合取规则的概率,即推断结果:
(7)
采用交叉熵损失函数来衡量预测结果与真实结果的差异,求损失,其中是规则的真实标签,通过相关项标签的布尔值的合取运算获得;表示训练集合样本期望;训练过程通过最小化损失以更新UNet和合取规则检测模块中的所有参数,表示使用范数来对UNet和合取规则检测模块中的所有参数进行正则化:
(8)
2-3)析取范式检测
析取范式检测用于验证输入文本是否满足完整的用户规则集;
输入为:步骤2-2)中的合取规则表示向量和其他相关的合取规则表示向量;
输出为:预测输入文本满足用户规则集的概率;
采用
(9)
采用交叉熵损失函数,求损失,如公式(10)所示,其中是输入文本的真实标签,由专家标注文本是否满足用户需求,表示训练集合样本期望,训练过程通过最小化损失以更新语义逻辑网络的所有参数,表示使用范数来对语义逻辑网络的参数进行正则化:
(10)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110984877.9/1.html,转载请声明来源钻瓜专利网。