[发明专利]一种用于文本摘要的生成方法和系统有效

专利信息
申请号: 201910926161.6 申请日: 2019-09-27
公开(公告)号: CN110705287B 公开(公告)日: 2023-06-30
发明(设计)人: 吴家鸣;李敏 申请(专利权)人: 北京妙笔智能科技有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30;G06N3/0464;G06N3/08
代理公司: 厦门福贝知识产权代理事务所(普通合伙) 35235 代理人: 陈远洋
地址: 100015 北京市朝阳区酒*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 文本 摘要 生成 方法 系统
【权利要求书】:

1.一种用于文本摘要的生成方法,其特征在于,包括以下步骤:

S1:对待处理文本进行预处理,其中,所述预处理包括去除所述待处理文本的html标签以及对所述待处理文本进行分词处理;

S2:基于TF-IDF统计方法,获取待处理文本中文本单元的权重;

S3:利用ilp算法、submodular算法和centroid算法分别计算获得所述待处理文本的第一文本摘要、第二文本摘要和第三文本摘要;基于深度卷积网络学习模型,获取所述待处理文本的第四文本摘要;响应于所述文本单元中含有预先建立的摘要词库中的词汇,获取第五文本摘要;

S4:将所述第一文本摘要、所述第二文本摘要、所述第三文本摘要、所述第四文本摘要和所述第五文本摘要进行加权计算,获取所述待处理文本的文本摘要;

其中,所述步骤S3中利用submodular算法获得所述第二文本摘要的具体方式为:利用贪心算法计算所述文本单元满足submodular函数最大化,submodular函数公式如下:

f(s∩t)+f(s∪t)≤f(s)+f(t)

其中,f为submodular函数,v表示文档中所有文本单元的集合,s、t表示抽取的文本摘要,ci表示非负实数,β表示计划选择文本单元数;

所述步骤S4中所述第四文本摘要的获取方式具体包括:

基于将所述待处理文本、分割符和所述文本单元输入至输入层,基于word2vec将词语转换为向量值输入至卷积层,进行最大池化运算,输入至输出层进行softmax计算,利用标准结果进行差的运算调整卷积层和输出层的参数,进行深度神经网络的训练;

基于所述深度神经网络的训练,判断所述文本单元是否为文本摘要,输出所述第四文本摘要;

所述文本摘要的计算公式为:ji=∑(pdd+pii+pss+pcc+pll),其中,pd表示深度学习获取的所述第四文本摘要的准确率,pi表示ilp算法获取的所述第一文本摘要的准确率,ps表示submodular算法获取的所述第二文本摘要的准确率,pc表示centroid算法获取的所述第三文本摘要的准确率,pl表示摘要词库获取的所述第五文本摘要的准确率,d、i、s、c、l分别表示深度学习、ilp、submodular、centroid、摘要词库获取的文本摘要是否为待处理文本摘要的判断,取1表示是待处理文本摘要,取0表示不是待处理文本摘要。

2.根据权利要求1所述的用于文本摘要的生成方法,其特征在于,所述TF-IDF的计算公式如下:TF-IDF=TF*IDF,其中TF表示词频,即某个词在文本中出现次数,IDF表示逆文档频率,具体计算为

3.根据权利要求1所述的用于文本摘要的生成方法,其特征在于,所述步骤S2中利用ilp算法获得所述第一文本摘要的具体方式为:对所述待处理文本进行概念抽取,利用带有约束的优化解进行计算,进而获得所述第一文本摘要,具体计算公式如下:

其中,xi表示所述待处理文本的概念,s(xi)表示所述概念的权值函数,表示所述概念是否出现在文本摘要中,dj表示抽取的单元,n(dj)表示dj中的单词个数,表示抽取单元是否在文本摘要中,R表示文本摘要的长度约束,b(i,j)为二元常量,表示xi是否出现在dj中,sim表示计算冗余度度量,δ表示冗余门槛值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京妙笔智能科技有限公司,未经北京妙笔智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910926161.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top