[发明专利]一种基于上下文语义感知的抽取式文档自动摘要方法有效
申请号: | 201910946636.8 | 申请日: | 2019-10-06 |
公开(公告)号: | CN110728144B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 熊才权;沈力;王壮;周磊;陈曦 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06F16/34 | 分类号: | G06F16/34;G06F40/211;G06F40/289;G06F40/30;G06N3/0464;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 张辰 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于上下文语义感知的抽取式文档自动摘要方法,该方法主要解决传统的算法缺乏对于句子在不同的语境中的辨识度的问题。本发明首先用LDA主题模型计算文档中的主题概率分布,进而确定每一个句子与主题词的相似度。然后用CNN模型提取句子的语义特征,进而计算每一个句子与特征的相似度,然后最后把每一个句子的主题相似度和特征相似度的值相加,得到最终的句子得分,按得分排名取合适数量的语句作为摘要。该方法引入了主题模型和深度学习模型,确定了一种主题摘要方法,能够更加精确的分析其不同语境中的句子含义,也为其他的文档自动摘要方法提供了一种计算参考方法。 | ||
搜索关键词: | 一种 基于 上下文 语义 感知 抽取 文档 自动 摘要 方法 | ||
【主权项】:
1.一种基于上下文语义感知的抽取式文档自动摘要方法,其特征在于:抽取式文档自动摘要是以句子在文档中的重要程度来打分,本方法采用LDA主题模型与CNN卷积神经网络来提取文档中的深层次的语义信息并作为句子评分的依据,最终形成摘要,所述方法包含如下步骤:/n步骤1:对所给的初始文档进行预处理,具体步骤包括:/n步骤1.1:对初始的文档进行分词、分句;/n步骤1.2:根据步骤1.1所得到分词的结果,去除语气助词、副词、介词、连词这些自身并无明确意义的停用词;/n步骤1.3:指定初始文档的主题数K,每个主题下的词的数量为V;/n步骤1.4:指定超参数向量
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910946636.8/,转载请声明来源钻瓜专利网。