[发明专利]基于词迁徙学习的深度文本匹配方法及装置有效
申请号: | 201910285841.4 | 申请日: | 2019-04-10 |
公开(公告)号: | CN109992648B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 李健铨;刘小康;晋耀红 | 申请(专利权)人: | 北京神州泰岳软件股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/289;G06F40/30 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100080 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种基于词迁徙学习的深度文本匹配方法及装置,在训练深度匹配模型时,融合BERT模型并对其做预训练;然后,利用预训练后的BERT模型,将输入的句子对中的语句分别用初始词向量表示,再将用初始词向量表示的句子对中的语句进行相似性加权,得到加权后的语句向量;最后,根据语句向量的相似度值对应的损失值,调整模型参数,利用参数调整最终得到的深度匹配模型,对输入的语句进行文本匹配。由于预训练后的BERT模型的参数不再是随机初始化的参数、且在预训练BERT模型中还加入词性预测,丰富词向量语义信息。因此,用训练的BERT模型对句子对中的语句用词向量表示的语义更为准确,促进训练后模型的匹配准确率提升。 | ||
搜索关键词: | 基于 迁徙 学习 深度 文本 匹配 方法 装置 | ||
【主权项】:
1.一种基于词迁徙学习的深度文本匹配方法,应用于深度匹配模型,其特征在于,所述方法包括:将从语料集抽取的语句序列输入至BERT模型,对所述BERT模型进行预训练,其中,所述预训练的任务包括所述语句序列中两个语句是否为上下句的预测、两个语句中掩盖词预测和所述掩盖词的词性预测;利用预训练后的BERT模型,将输入的句子对中的语句分别用词向量表示,得到所述句子对中各语句的词向量矩阵;利用各所述词向量矩阵所对应的相似度矩阵,生成所述句子对中的语句彼此相似性加权后的语句向量;根据各所述语句向量之间的匹配程度值,计算预设损失函数的损失值;根据所述损失值,调整所述深度匹配模型的参数;利用参数调整所最终得到的深度匹配模型,对输入的语句进行文本匹配。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京神州泰岳软件股份有限公司,未经北京神州泰岳软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910285841.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种内容搜索方法及装置
- 下一篇:聊天机器人的会话方法、装置及终端