[发明专利]缩略句理解模型的训练方法及系统有效
申请号: | 201911407761.8 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111160010B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 朱钦佩 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/284;G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 缩略 理解 模型 训练 方法 系统 | ||
1.一种缩略句理解模型的训练方法,包括:
接收对话训练数据集,所述对话训练数据集包括:用户连续请求的第一轮完整语句、第二轮缩略语句,以及用于表示所述第二轮缩略语句的目标完整语句;
构建基于encoder-decoder框架的缩略句理解模型,所述缩略句理解模型包括encoder-编码层以及decoder-解码层,其中,所述缩略句理解模型用于将省略句还原为完整语句;
将所述第一轮完整语句、所述第二轮缩略语句作为所述encoder-编码层的输入,通过自注意力机制确定出所述第二轮缩略语句的第二句子特征向量;
确定所述第一轮完整语句中每个词语的第一词特征向量,基于所述第一词特征向量以及所述第二句子特征向量,确定所述第二轮缩略语句与所述第一轮完整语句的关系特征向量,作为所述encoder-编码层的输出;
所述decoder-解码层基于所述关系特征向量,生成所述第二轮缩略语句的模拟完整语句,基于所述模拟完整语句以及所述目标完整语句对所述缩略句理解模型进行训练,以将所述模拟完整语句趋近所述目标完整语句;
其中,所述通过自注意力机制确定出所述第二轮缩略语句的句子特征向量包括:
通过自注意力机制输出所述第一轮完整语句、所述第二轮缩略语句中每个词语的特征向量,其中,所述词语的特征向量包括所述词语与其他词语之间的关系信息;
基于所述第二轮缩略语句中所有词语的特征向量,确定所述第二轮缩略语句的句子特征向量。
2.根据权利要求1所述的方法,其中,所述基于所述第二轮缩略语句中所有词语的特征向量,确定所述第二轮缩略语句的句子特征向量包括:
通过对所述第二轮缩略语句中所有词语的特征向量求平均,确定出所述第二轮缩略语句的句子特征向量。
3.根据权利要求1所述的方法,其中,所述确定所述第一轮完整语句中每个词语的第一词特征向量,基于所述第一词特征向量以及所述第二句子特征向量,确定所述第二轮缩略语句与所述第一轮完整语句的关系特征向量包括:
将所述第二句子特征向量与所述第一词特征向量进行注意力计算,得到多个所述第二轮缩略语句与所述第一轮完整语句的子关系特征向量;
将所述多个子关系特征向量进行拼接,得到关系特征向量。
4.一种缩略句理解模型的训练系统,包括:
数据接收程序模块,接收对话训练数据集,所述对话训练数据集包括:用户连续请求的第一轮完整语句、第二轮缩略语句,以及用于表示所述第二轮缩略语句的目标完整语句;
模型构建程序模块,用于构建基于encoder-decoder框架的缩略句理解模型,所述缩略句理解模型包括encoder-编码层以及decoder-解码层,其中,所述缩略句理解模型用于将省略句还原为完整语句;
句子特征确定程序模块,用于将所述第一轮完整语句、所述第二轮缩略语句作为所述encoder-编码层的输入,通过自注意力机制确定出所述第二轮缩略语句的第二句子特征向量;
关系特征确定程序模块,用于确定所述第一轮完整语句中每个词语的第一词特征向量,基于所述第一词特征向量以及所述第二句子特征向量,确定所述第二轮缩略语句与所述第一轮完整语句的关系特征向量,作为所述encoder-编码层的输出;
训练程序模块,用于所述decoder-解码层基于所述关系特征向量,生成所述第二轮缩略语句的模拟完整语句,基于所述模拟完整语句以及所述目标完整语句对所述缩略句理解模型进行训练,以将所述模拟完整语句趋近所述目标完整语句;
其中,所述通过自注意力机制确定出所述第二轮缩略语句的句子特征向量包括:
通过自注意力机制输出所述第一轮完整语句、所述第二轮缩略语句中每个词语的特征向量,其中,所述词语的特征向量包括所述词语与其他词语之间的关系信息;
基于所述第二轮缩略语句中所有词语的特征向量,确定所述第二轮缩略语句的句子特征向量。
5.根据权利要求4所述的系统,其中,所述句子特征确定程序模块还用于:
通过对所述第二轮缩略语句中所有词语的特征向量求平均,确定出所述第二轮缩略语句的句子特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911407761.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:搜索方法和设备
- 下一篇:一种基于自适应遗传算法的阵列稀疏优化方法