[发明专利]摘要抽取模型训练方法、摘要抽取方法、装置和电子设备在审
申请号: | 202011551872.9 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112560479A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 陈默也;李伟;刘家辰;肖欣延;洪豆 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06N3/04;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 摘要 抽取 模型 训练 方法 装置 电子设备 | ||
1.一种摘要抽取模型训练方法,包括:
获取文档样本及所述文档样本的标签信息;
确定所述文档样本之中每个句子的向量表示;
根据所述文档样本之中每个句子的向量表示,生成与所述文档样本对应的图表示;
获取所述文档样本的篇章整体向量表示,并将所述篇章整体向量表示和所述图表示输入至神经网络模型,获得候选句子的重要性得分和候选摘要句;
根据所述候选句子的重要性得分、所述候选摘要句和所述标签信息,训练所述神经网络模型,获得模型参数以形成摘要抽取模型。
2.根据权利要求1所述的摘要抽取模型训练方法,其中,所述根据所述文档样本之中每个句子的向量表示,生成与所述文档样本对应的图表示,包括:
将所述文档样本之中每个句子作为所述图表示之中的节点;
基于预设算法,依据所述文档样本之中每个句子的向量表示,获取所述文档样本之中各个句子之间的相互联系;
将所述相互联系,作为所述图表示中对应节点间的边。
3.根据权利要求2所述的摘要抽取模型训练方法,其中,所述预设算法包括:
基于词频TF-逆文本频率指数IDF的文本相似度算法,或者,余弦相似度算法。
4.根据权利要求1所述的摘要抽取模型训练方法,其中,所述将所述篇章整体向量表示和所述图表示输入至神经网络模型,获得候选句子的重要性得分和候选摘要句,包括:
基于所述图表示之中的节点以及边,确定所述图表示之中每个节点的向量表示;
将所述篇章整体向量表示分别与每个所述节点的向量表示进行拼接;
将拼接后得到的向量表示输入至神经网络模型进行句子打分和候选摘要句的预测,获取预测得到的候选句子的重要性得分和候选摘要句。
5.根据权利要求1所述的摘要抽取模型训练方法,其中,所述标签信息包括所述文档样本中句子的重要性得分标签和参考摘要句标签;所述根据所述候选句子的重要性得分、所述候选摘要句和所述标签信息,训练所述神经网络模型,包括:
基于第一损失函数,计算所述候选句子的重要性得分与所述标签信息之中所述句子的重要性得分标签的第一损失值;
基于第二损失函数,计算所述候选摘要句与所述参考摘要句标签的第二损失值;
根据所述第一损失值和所述第二损失值训练所述神经网络模型。
6.一种摘要抽取方法,包括:
确定文档文本中每个句子的向量表示;其中,所述文档文本为单文档文本或多文档文本;
根据所述文档文本中每个句子的向量表示,生成与所述文档文本对应的图表示;
获取所述文档文本的篇章整体向量表示,并将所述篇章整体向量表示和所述图表示输入至预先训练的摘要抽取模型,获得针对所述文档文本的摘要句。
7.根据权利要求6所述的方法,其中,所述根据所述文档文本中每个句子的向量表示,生成与所述文档文本对应的图表示,包括:
将所述文档文本之中每个句子作为所述图表示之中的节点;
基于预设算法,依据所述文档文本之中每个句子的向量表示,获取所述文档文本之中各个句子之间的相互联系;
将所述相互联系,作为所述图表示中对应节点间的边。
8.根据权利要求6所述的方法,其中,所述将所述篇章整体向量表示和所述图表示输入至预先训练的摘要抽取模型,获得针对所述文档文本的摘要句,包括:
基于所述图表示之中的节点以及边,确定所述图表示之中每个节点的向量表示;
将所述篇章整体向量表示分别与每个所述节点的向量表示进行拼接;
将拼接后得到的向量表示输入至所述摘要抽取模型,获得针对所述文档文本的摘要句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011551872.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:铁路线要素传输方法及系统
- 下一篇:一种乳癌根治术后的义乳装置