[发明专利]一种利用关联模型实现自动摘要的方法无效

专利信息
申请号: 200810175851.4 申请日: 2008-11-06
公开(公告)号: CN101393545A 公开(公告)日: 2009-03-25
发明(设计)人: 邓剑波;倪显见;戴云川;詹天荣;张森;胡显茹 申请(专利权)人: 新百丽鞋业(深圳)有限公司
主分类号: G06F17/27 分类号: G06F17/27;G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 518033广东省深圳市福田*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种利用关联模型实现自动摘要的方法,通过统计文档中的关键词和词频信息,建立文章的“关联网络”,依据该关联网络中的关联度作为分析句子重要性的指标来确定文章中的重要句子,进而根据要求生成文档摘要;能够在速度相对较快的同时,保证自动摘要的结果比较令人满意,且对文档的通用程度比较好,而且基本原理不受语言种类限制。
搜索关键词: 一种 利用 关联 模型 实现 自动 摘要 方法
【主权项】:
1、一种利用关联模型实现自动摘要的方法,包括以下几个步骤:(1)对文章进行预处理:基于标点,将文档切分为句子序列,统计全文词频,综合词性信息,使用关键词生成模块,得到文中的关键词与词频信息;(2)对文章进行关联模型化处理:A. 关键词权值的关联度优化:若多个关键词之间出现有主题上的关联,将该种关联作为一个调节因子加到原关键词的权值上;B. 句子关联化:根据关键词列表中的信息,反过来可以得到每个句子关键词的词频,依据每个句子所包含的关键词和词频信息可通过公式计算得到句子间的关联度,从而得到整个文章的句子关联网络;(3)基于句子关联网络的文章分析:A. 基于文章内容主轴的分析:针对文章规模小于给定阈值的文章,可以把文章看成是句子和其关联度组成的关联网络,求出每个句子与文章内容主轴的关联度,即得到每个句子与全文的关联度,即每个句子在文章中所占的权重;B. 基于文章子主题的分析:针对文章规模大于给定阈值的文章,可以把文章看成是由若干子主题构成的,每个子主题由一个句子簇构成,每个句子簇有一个句子簇的内容主轴,可以基于句子关联网络,按句子间的相关度将文档划分为表示不同子主题的句子簇序列;(4)生成摘要并输出最后,在全文或每个簇中,按句子的权重由高到低排列,根据用户需要的摘要文字的规模,依次选出权重相对较高的句子,通过用户界面输出给用户使用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新百丽鞋业(深圳)有限公司,未经新百丽鞋业(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810175851.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top