[发明专利]基于词细粒度的长文本摘要生成方法在审
申请号: | 202211609887.5 | 申请日: | 2022-12-12 |
公开(公告)号: | CN115906805A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 郑园园;张舒 | 申请(专利权)人: | 长春理工大学 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/289;G06F40/30;G06F18/22;G06F18/25 |
代理公司: | 上海思真远达专利代理事务所(特殊普通合伙) 31481 | 代理人: | 解丽丽 |
地址: | 130022 吉林*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及的是基于词细粒度的长文本摘要生成方法,涉及信息处理技术领域,本发明结合了传统算法和深度学习算法来解决大数据条件下难以将文本转换为言简意赅的摘要的问题,方法包括以下步骤:将一篇原文本进行文本预处理;再将句子集合载入训练好的改进的NEZHA编码模型中;再将具有语义信息的句子向量载入TextRank算法当中,为每个句子进行排序打分,得到每个句子的重要性得分;最后利用改进的MMR算法过滤掉高耦合的句子,得到低相关高得分的摘要句子集合,即原文本的摘要;本发明不限制输入文本的字数,并从字、词语、句子多角度挖掘文本的内部信息,又考虑整个文本的结构特征以确保生成的摘要内容的质量、准确性以及可靠性。 | ||
搜索关键词: | 基于 细粒度 文本 摘要 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202211609887.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种带有滑轨的户外上翻式遮阳天幕
- 下一篇:钢结构网架杆件悬挂喷涂辅助用吊具