[发明专利]一种利用关联模型实现自动摘要的方法无效
申请号: | 200810175851.4 | 申请日: | 2008-11-06 |
公开(公告)号: | CN101393545A | 公开(公告)日: | 2009-03-25 |
发明(设计)人: | 邓剑波;倪显见;戴云川;詹天荣;张森;胡显茹 | 申请(专利权)人: | 新百丽鞋业(深圳)有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518033广东省深圳市福田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种利用关联模型实现自动摘要的方法,通过统计文档中的关键词和词频信息,建立文章的“关联网络”,依据该关联网络中的关联度作为分析句子重要性的指标来确定文章中的重要句子,进而根据要求生成文档摘要;能够在速度相对较快的同时,保证自动摘要的结果比较令人满意,且对文档的通用程度比较好,而且基本原理不受语言种类限制。 | ||
搜索关键词: | 一种 利用 关联 模型 实现 自动 摘要 方法 | ||
【主权项】:
1、一种利用关联模型实现自动摘要的方法,包括以下几个步骤:(1)对文章进行预处理:基于标点,将文档切分为句子序列,统计全文词频,综合词性信息,使用关键词生成模块,得到文中的关键词与词频信息;(2)对文章进行关联模型化处理:A. 关键词权值的关联度优化:若多个关键词之间出现有主题上的关联,将该种关联作为一个调节因子加到原关键词的权值上;B. 句子关联化:根据关键词列表中的信息,反过来可以得到每个句子关键词的词频,依据每个句子所包含的关键词和词频信息可通过公式计算得到句子间的关联度,从而得到整个文章的句子关联网络;(3)基于句子关联网络的文章分析:A. 基于文章内容主轴的分析:针对文章规模小于给定阈值的文章,可以把文章看成是句子和其关联度组成的关联网络,求出每个句子与文章内容主轴的关联度,即得到每个句子与全文的关联度,即每个句子在文章中所占的权重;B. 基于文章子主题的分析:针对文章规模大于给定阈值的文章,可以把文章看成是由若干子主题构成的,每个子主题由一个句子簇构成,每个句子簇有一个句子簇的内容主轴,可以基于句子关联网络,按句子间的相关度将文档划分为表示不同子主题的句子簇序列;(4)生成摘要并输出最后,在全文或每个簇中,按句子的权重由高到低排列,根据用户需要的摘要文字的规模,依次选出权重相对较高的句子,通过用户界面输出给用户使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新百丽鞋业(深圳)有限公司,未经新百丽鞋业(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810175851.4/,转载请声明来源钻瓜专利网。
- 上一篇:废气净化器
- 下一篇:一种冷冻虾仁的质量评价方法