[发明专利]槽填充模型训练方法、电子设备及存储介质有效

申请号：	202010820531.0	申请日：	2020-08-14
公开（公告）号：	CN111898379B	公开（公告）日：	2023-08-22
发明（设计）人：	俞凯;曹瑞升;朱苏	申请（专利权）人：	思必驰科技股份有限公司
主分类号：	G06F40/289	分类号：	G06F40/289;G06F40/30
代理公司：	北京商专永信知识产权代理事务所(普通合伙) 11400	代理人：	黄谦;车江华
地址：	215123 江苏省苏州市苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	填充模型训练方法电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种槽填充模型训练方法，包括：对所述槽填充模型进行多轮次训练，每轮次训练包括以下步骤：

从预设训练集中选择一个领域作为目标训练领域；

为所述目标训练领域中的多个标签分别配置多个标注样本，以构成支撑集；

从所述目标训练领域的其它标注样本中选择多个标注样本构成元测试数据，用于当前轮次训练的测试；

将训练目标设置为最大化所述元测试数据的真实标注预测概率；

所述预设训练集包含一系列标注样本对：其中，x＝(x₁，x₂，...，x_|x|)表示输入句子序列，y＝(y₁，y₂，...，y_|x|)表示输出序列标注，所述预设训练集中包含M个领域{D₁，D₂，...，D_M}，每个领域配置有一套标签集合；所述将训练目标设置为最大化所述元测试数据的真实标注预测概率通过以下公式实现：

其中，θ表示所述槽填充模型的参数，所述目标训练领域表示为D_t，所述支撑集为(x，y)对来自目标训练领域；

其中，f_T(y_i-1，y_i)是第i步的转移分数，f_E(y_i，x，S)是第i步的发射分数；

SIM为单词-标签相似性函数，E表示上下文词嵌入函数，c_yi是从所述支撑集S中提取的y_i的标签嵌入；所述标签嵌入由以下公式确定：

其中，是所述支撑集S中标有y_i的单词的数量。

2.根据权利要求1所述的方法，其中，所述单词-标签相似性函数实现为：

其中，x_i表示单词嵌入，c_k表示归一化标签向量。

3.根据权利要求1所述的方法，其中，所述单词-标签相似性函数实现为：

其中，x_i表示单词嵌入，c_k表示归一化标签向量，为偏置项。

4.根据权利要求1-3中任一项所述的方法，其中，

5.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-4中任意一项所述方法的步骤。

6.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-4中任意一项所述方法的步骤。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。