[发明专利]关键句提取方法及装置有效
申请号: | 201911051620.7 | 申请日: | 2019-10-31 |
公开(公告)号: | CN110852064B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 费志辉;李超 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/211;G06F40/289;G06F16/33 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 汪阮磊 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键 提取 方法 装置 | ||
1.一种关键句提取方法,其特征在于,包括:
获取需要确定关键句的目标文章;
对所述目标文章进行提取处理,得到至少一个候选句以及候选句对应的上下文信息,包括:对所述目标文章进行分句处理,得到按序排列的分句;从所述分句中选择分句作为候选句;根据上下文信息提取条件,从所述分句中选择分句作为所述候选句对应的上下文信息;
对所述候选句以及候选句对应的上下文信息进行特征提取,得到候选句的特征信息,包括:获取训练后的神经网络模型;使用训练后的神经网络模型对所述候选句以及对应候选句的上下文信息进行特征提取,得到候选句的特征信息;
根据所述候选句的特征信息以及关键句提取条件,从所述至少一个候选句中确定所述目标文章的关键句,包括:根据所述候选句的特征信息的相似度将所述候选句进行分类,根据不同类别的候选句以及所述关键句提取条件确定所述目标文章的关键句。
2.如权利要求1所述的关键句提取方法,其特征在于,所述根据上下文信息提取条件,从所述分句中选择分句作为所述候选句对应的上下文信息的步骤,包括:
根据上下文信息提取条件,确定上下文信息所包含的分句数量以及与所述候选句的相对位置;
根据所述分句数量以及所述相对位置,从所述分句中选择分句作为所述候选句对应的上下文信息。
3.如权利要求2所述的关键句提取方法,其特征在于,所述根据所述分句数量以及所述相对位置,从所述分句中选择分句作为所述候选句对应的上下文信息的步骤,包括:
根据所述相对位置,确定所述候选句的上下文信息候选集,所述上下文信息候选集包括至少一个分句;
根据所述分句数量,从所述上下文信息候选集中选择分句作为所述候选句对应的上下文信息。
4.如权利要求1所述的关键句提取方法,其特征在于,所述从所述分句中选择分句作为候选句的步骤,包括:
确定各分句的字数;
选择字数处于预设字数范围的分句作为候选句。
5.如权利要求1所述的关键句提取方法,其特征在于,所述从所述分句中选择分句作为候选句的步骤,包括:
获取所述目标文章的关键分词;
将包含所述关键分词的分句作为候选句。
6.如权利要求1所述的关键句提取方法,其特征在于,所述获取训练后的神经网络模型的步骤,包括:
获取样本文章以及所述样本文章的关键句;
利用所述样本文章以及所述样本文章的关键句,对预设的神经网络模型进行训练,得到训练后的神经网络模型。
7.如权利要求1所述的关键句提取方法,其特征在于,所述获取训练后的神经网络模型的步骤,包括:
预先处理候选句以及对应候选句的上下文信息,得到候选句的特征信息;
使用训练后的神经网络模型对候选句以及对应候选句的上下文信息进行特征提取,得到候选句的特征信息;
对比预先处理得到的候选句的特征信息和训练后的神经网络模型得到的候选句的特征信息,在预先处理得到的候选句的特征信息和训练后的神经网络模型得到的候选句的特征信息相同时,确定训练后的神经网络模型。
8.一种关键句提取装置,其特征在于,包括:
获取模块,用于获取需要确定关键句的目标文章;
提取处理模块,用于对所述目标文章进行提取处理,得到至少一个候选句以及候选句对应的上下文信息,包括:对所述目标文章进行分句处理,得到按序排列的分句;从所述分句中选择分句作为候选句;根据上下文信息提取条件,从所述分句中选择分句作为所述候选句对应的上下文信息;
特征获取模块,用于对所述候选句以及候选句对应的上下文信息进行特征提取,得到候选句的特征信息,包括:获取训练后的神经网络模型;使用训练后的神经网络模型对所述候选句以及对应候选句的上下文信息进行特征提取,得到候选句的特征信息;
关键句获取模块,用于根据所述候选句的特征信息以及关键句提取条件,从所述至少一个候选句中确定所述目标文章的关键句,包括:根据所述候选句的特征信息的相似度将所述候选句进行分类,根据不同类别的候选句以及所述关键句提取条件确定所述目标文章的关键句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911051620.7/1.html,转载请声明来源钻瓜专利网。