[发明专利]文件群集的自动摘要判断方法无效

专利信息
申请号: 201110424071.0 申请日: 2011-12-08
公开(公告)号: CN103164473A 公开(公告)日: 2013-06-19
发明(设计)人: 蔡弘扬;高子腾;薛格闵 申请(专利权)人: 易搜比控股公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京律诚同业知识产权代理有限公司 11006 代理人: 梁挥;常大军
地址: 英属开曼群*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文件 群集 自动 摘要 判断 方法
【说明书】:

技术领域

发明涉及一种文件的摘要处理方法,特别涉及一种文件群集的自动摘要判断方法。

背景技术

计算机及因特网的快速发展,造成因特网信息量的快速爆增。一般而言,使用者大都是通过特定的入口网站观看所喜爱的内文。所谓的文件泛指的是网页中的文章、新闻或信息,亦可称的为数字文件,由于目前数字科技的普遍运用,近年来文件的产生极为快速,数量非常庞大,而且为达到即时的更新页面中的各项文件的版面的目的,大多数的文件提供者(例如入口网站)都会提供文件内容的摘要处理与显示,藉以提供使用者可以同时观看更多数量的文件。

现有的文件摘要处理是将文件中的主文内容进行部分的摘录。诚如前文所提到,入口网站每一天所接收到的文件数量是非常庞大的。若使用人工进行摘要处理的话,对于厂商不啻为一项沉重的负担。因此文件提供者多会采用自动摘要的处理,其处理方式是将主文中的标题或前几个字直接取出,将其当成该篇文件的摘要并显示于首页中,也就是说现有的摘要处理方法虽然可以提高同一页面中的文章显示数量,但是大部分为求处理快速,仅仅撷取主文部分文字作为该篇文件的摘要,而未做摘要内容是否符合贴近主文重点或摘要内容是否充足丰富的判断,于是造成使用者在浏览该篇摘要时,常难以理解该篇文件的真正内容,不符合现代使用者浏览重点式摘要的需求。

发明内容

有鉴于上述问题,本发明的主要目的在于揭露一种文件群集的自动摘要判断方法,以期能在使用者浏览选定的文件群集(该文件群集即为一网站的页面内容或该网站的一个频道页面内容),先判断该文件群集中所夹带的所有子文件的原始摘要内容是否充足且贴近主文重点,经由本发明的多个判断步骤分析是否需就该文件群集的内容(其中所有的子文件)产出更贴近主文重点的摘要重组内容(较佳的摘要内容),以求能更符合使用者浏览重点式摘要的需求。

为达成上述目的,本发明的主要技术手段包含下列步骤:(A)建立一数据库,将使用者预载的每一个包含有多笔子文件摘要内容及主文内容的文件群集包装储存成对应的文件群集历程记录文件,每一个该文件群集历程记录文件中记录有该些子文件的该摘要内容及该主文内容,并设置有一文件累计数值、一摘要化累计次数值及一摘要化成功次数值;(B)针对使用者欲浏览的该文件群集,于该数据库中取出对应的该文件群集历程记录文件;再针对该文件群集历程记录文件中的每一笔子文件的摘要内容,配合一文件累计数值、一摘要化累计次数值及一摘要化成功次数值,进行下列主要的回圈式判断步骤,直至文件群集历程记录文件中所有的子文件的摘要内容都被处理过为止,(C)针对其中该文件累计数值判断是否大于一第一门槛值;(D)计算该摘要化累计次数值及该摘要化成功次数值以产生一摘要化成功率数值;(E)判断该摘要化成功率数值是否大于一第二门槛值;(F)判断该笔子文件的摘要内容长度是否大于一第三门槛值;(G)针对该笔子文件的主文内容进行一摘要化处理,产出一新摘要内容;(J)输出新摘要内容。

其中,文件累计数值、摘要化累计次数值及摘要化成功次数值会随着数据库中文件群集历程记录文件的建置和上述判断步骤的执行过程中而不断变化,由上述判断步骤(其中步骤(H)至步骤(I)是为更新该文件群集记录文件的动作,故未列于前述步骤中,有关本发明详细步骤细节将于实施方式中搭配实施例阐述),得以于使用者浏览选定的文件群集内容前,先行判断是否需就该文件群集内容中的所有子文件的摘要内容进行摘要处理的动作,以产出更贴近主文重点的新摘要内容,提供使用者较佳的摘要浏览需要。

本发明还可延伸设置更多的数值及增加更细微的判断步骤进行交叉比对,藉以检查并输出最佳化的摘要结果供使用者浏览,如于步骤(G)中还包含:(G1)比对新摘要内容长度与该笔子文件的(原始)摘要内容长度,若新摘要内容长度小于该笔子文件的(原始)摘要内容长度,则表示该笔子文件的(原始)摘要内容较丰富,便直接选择输出该笔子文件的(原始)摘要内容;(G2)若新摘要内容长度大于该笔子文件的摘要内容长度,则代表经上述步骤所产出的新摘要内容较丰富,而进行步骤(J)输出更符合使用者浏览需求的新摘要内容。

以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。

附图说明

图1本发明一较佳实施例的方框执行程序示意图。

图2本发明一较佳实施例的文件群集历程记录文件的示意图。

图3一新闻网页对照解说示意图。

图4本发明一较佳实施例的详细步骤流程图。

图5该较佳实施例的一新增步骤示意图。

图6该较佳实施例的另一新增步骤示意图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易搜比控股公司,未经易搜比控股公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110424071.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top