[发明专利]基于特征重构和抽象类转移概率的小样本槽位填充方法在审
申请号: | 202211664226.2 | 申请日: | 2022-12-23 |
公开(公告)号: | CN116089580A | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 张春霞;李雅菲;徐天祥;薛晓军;牛振东 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/33;G06F18/213;G06F40/30;G06N20/00 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王松 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 抽象 转移 概率 样本 填充 方法 | ||
1.基于特征重构和抽象类转移概率的小样本槽位填充方法,其特征在于,包括以下步骤:
步骤1:利用成对上下文编码,生成标记Token的嵌入向量;
步骤2:基于特征重构网络计算Token隶属于槽位标签的概率,即发射概率;通过计算句子中每个Token的发射概率,即Token与各个槽位标签类别表示的相似度;
步骤3:获取抽象类转移概率和具体类转移概率;
通过计算具体类转移概率,即相邻两个具体槽位标签之间的转移概率,如下式所示:
fT(yi-1,yi)=p(yi|yi-1)
其中,fT表示转移概率,yi表示槽位标注序列,p表示条件概率;
在训练集中,建模学习抽象类槽位标签的转移概率;
在测试集中,对于新的槽位标签类别,将抽象类槽位标签的转移概率具体化,获得具体类槽位标签的转移概率;
步骤4:计算句子中Token序列的序列标注概率,句子的Token序列根据序列标注概率,输出Token隶属的槽位标签。
2.如权利要求1所述的基于特征重构和抽象类转移概率的小样本槽位填充方法,其特征在于,步骤1中,采用基于预训练模型BERT的成对上下文编码,生成Token的嵌入向量;
首先,对于待标注的句子x,支撑集中的Ns个句子将句子x和这些Ns个句子分别配对;
然后,将配对结果分别输入到BERT中,共获得Ns个句子x的向量,对这些向量取均值后,作为句子x的最终向量表示,同时获得句子x中各个Token的向量。
3.如权利要求1所述的基于特征重构和抽象类转移概率的小样本槽位填充方法,其特征在于,步骤2包括以下步骤:
步骤2.1:构建槽位标签的语义特征向量;
初始化一组参考向量φ1,φ2,...,φN,N为槽位标签类别个数,也就是为每个槽位标签类别生成对应的参考向量;
使用BIO标注方法,其中,B:Begin标签表示槽位值片段的开始Token位置,I:Inner标签表示槽位值片段的中间Token位置,O:Other标签表示该Token不属于槽位值;
对于B-X和I-X标签,由两部分组成,第一部分是B或I,全称为Begin或Inner,第二部分是X,表示槽位标签的语义信息;
将B、I、O标签称为抽象类槽位标签,将X称为具体类槽位标签;将抽象类槽位标签和具体类槽位标签拼接,称为槽位标签名称;
步骤2.2:修正槽位标签类别的参考向量;
在一个支撑集中,对于隶属于槽位标签类别i的Token样本,经过成对上下文编码获得Token样本表示;对隶属于槽位标签类别i的所有Token样本表示取均值,获得原型表示ci;
首先,对于槽位标签类别i,生成i的标签语义增强的参考向量ψi,如式1所示:
ψi=(1-α)·φi+αsi (1)
其中,α是一个平衡因子,φi是槽位标签类别i的初始化参考向量,si是槽位标签类别i的语义特征向量;
对标签语义增强的参考向量ψi进行修正,如式2所示:
其中,N表示槽位标签类别个数,ψk表示槽位标签类别k的标签语义增强的参考向量;
然后,计算修正后的参考向量和原型表示ci之间的误差,如式3所示:
最后,使用映射矩阵M减少该误差到0,如式4所示:
M=nullD([ε1;ε2;...;εN]) (4)
其中,D表示M的列数,null表示M是εi的一个线性零解,即映射矩阵M和误差εi的关系为εiM=0;计算矩阵M;
步骤2.3:获得槽位标签类别表示,计算Token和槽位标签类别表示的相似度,即发射概率;
首先,为了获得标签类别表示Ωi,融合标签语义增强的参考向量和原型表示ci,如式5所示:
其中,β为平衡因子;
然后,生成Token嵌入;将标签类别表示Ωi和Token的嵌入表示,经过映射矩阵M映射到新的表示空间中;在新的表示空间中,计算Token嵌入和槽位标签类别表示之间的相似度,如式6至式10所示:
z'=E(z) (6)
其中,z表示句子x中的Token,是新的表示空间中的Token嵌入表示,表示文本序列,E表示成对上下文编码,M是映射矩阵,是新的表示空间中的槽位标签类别表示,SIM表示采用点积来计算Token和槽位标签类别表示之间的相似度,S为支撑集,fE表示发射概率,yi表示槽位标注序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211664226.2/1.html,转载请声明来源钻瓜专利网。