[发明专利]语义特征的生成方法、模型训练方法、装置、设备及介质有效
申请号: | 202011562653.0 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112560501B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 王硕寰;丁思宇;尚骏远;孙宇 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06K9/62;G06N20/20 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语义 特征 生成 方法 模型 训练 装置 设备 介质 | ||
1.一种语义特征的生成方法,其中,所述方法包括:
对目标文档进行片段切分,得到目标文档的片段序列;
采用预先训练的双向语义编码模型,生成所述目标文档的片段序列中各文档片段的语义特征;所述双向语义编码模型包括左编码模块和右编码模块,其中所述左编码模块对各所述文档片段编码时参考所述片段序列中的所述文档片段的上文片段的语义信息,所述右编码模块对各所述文档片段编码时参考所述片段序列中的所述文档片段的下文片段的语义信息;所述左编码模块和所述右编码模块的注意力机制在各所述文档片段内是双向的,在不同所述文档片段之间是单向的,使得生成的各文档片段的语义特征参考了所述片段序列中的所有文档片段;
基于所述目标文档的片段序列中各所述文档片段的语义特征,获取所述目标文档的语义特征。
2.根据权利要求1所述的方法,其中,采用预先训练的双向语义编码模型,生成所述目标文档的片段序列中各文档片段的语义特征,包括:
采用所述双向语义编码模型中的左编码模块,获取所述目标文档的片段序列中各文档片段的左编码特征;
采用所述双向语义编码模型中的右编码模块,获取所述目标文档的片段序列中各文档片段的右编码特征;
对于所述目标文档的片段序列中各所述文档片段,将对应的所述文档片段的左编码特征和对应的所述文档片段的右编码特征拼接,得到对应的所述文档片段的语义特征。
3.根据权利要求1或者2所述的方法,其中,基于所述目标文档的片段序列中各所述文档片段的语义特征,获取所述目标文档的语义特征,包括:
基于所述目标文档的片段序列中各文档片段的语义特征,并参考待匹配的搜索词的语义特征,获取所述目标文档的语义特征。
4.根据权利要求3所述的方法,其中,基于所述目标文档的片段序列中各文档片段的语义特征,并参考待匹配的搜索词的语义特征,获取所述目标文档的语义特征,包括:
计算所述目标文档的片段序列中各所述文档片段的语义特征和所述待匹配的搜索词的语义特征的相似度;
基于各所述文档片段的语义特征和所述待匹配的搜索词的语义特征的相似度,获取与所述待匹配的搜索词的语义特征的相似度最大的所述文档片段的语义特征,作为所述目标文档的语义特征。
5.一种双向语义编码模型的训练方法,其中,所述方法包括:
采集训练数据集;
基于采集的所述训练数据集,对包括左编码模块和右编码模块的双向语义编码模型进行训练;其中所述左编码模块对文档片段编码时参考所述文档片段所在的片段序列中、所述文档片段的上文片段的语义信息,所述右编码模块对所述文档片段编码时参考所述片段序列中的所述文档片段的下文片段的语义信息;所述左编码模块和所述右编码模块的注意力机制在各所述文档片段内是双向的,在不同所述文档片段之间是单向的,使得生成的各文档片段的语义特征参考了所述片段序列中的所有文档片段;
基于采集的所述训练数据集,对包括左编码模块和右编码模块的双向语义编码模型进行训练,包括:
基于采集的所述训练数据集,对所述双向语义编码模型中的所述左编码模块和所述右编码模块进行语义匹配任务的训练,使得所述双向语义编码模型学习语义匹配的能力。
6.根据权利要求5所述的方法,其中,采集训练数据集,包括:
采集包括数条训练语料的第一训练数据集。
7.根据权利要求6所述的方法,其中,基于采集的所述训练数据集,对包括左编码模块和右编码模块的双向语义编码模型进行训练,还包括:
基于采集的所述第一训练数据集中的数条训练语料,对所述双向语义编码模型中的所述左编码模块和所述右编码模块进行掩码训练,使得所述左编码模块和所述右编码模块学习预测掩码字符的能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011562653.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:双向行驶车辆锁桥装置及双头摆渡车
- 下一篇:一种3D玻璃滚压热弯模具