[发明专利]文件群集的自动摘要判断方法无效
申请号: | 201110424071.0 | 申请日: | 2011-12-08 |
公开(公告)号: | CN103164473A | 公开(公告)日: | 2013-06-19 |
发明(设计)人: | 蔡弘扬;高子腾;薛格闵 | 申请(专利权)人: | 易搜比控股公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 梁挥;常大军 |
地址: | 英属开曼群*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 群集 自动 摘要 判断 方法 | ||
1.一种文件群集的自动摘要判断方法,其特征在于,包括下列步骤:
(A)建立一数据库,将使用者预载的每一个包含有多笔子文件摘要内容及主文内容的文件群集包装储存成对应的文件群集历程记录文件,每一个该文件群集历程记录文件中记录有该些子文件的该摘要内容及该主文内容,并设置有一文件累计数值、一摘要化累计次数值及一摘要化成功次数值;
(B)针对使用者欲浏览的文件群集,于该数据库中取出对应的该文件群集历程记录文件;
(C)取出其中一笔子文件的该摘要内容,更新该文件累计数值并判断该文件累计数值是否大于一第一门槛值,若该文件累计数值小于该第一门槛值,则进行(F)步骤;
(D)若该文件累计数值大于该第一门槛值,则计算该摘要化累计次数值及该摘要化成功次数值,产生一摘要化成功率数值;
(E)判断该摘要化成功率数值是否大于一第二门槛值,若该摘要化成功率数值小于该第二门槛值,则进行(J)步骤;
(F)判断该摘要内容长度是否大于一第三门槛值,若该摘要内容长度大于该第三门槛值则进行(J)步骤;
(G)若该摘要内容长度小于该第三门槛值,对该子文件的该主文内容进行一摘要化处理,产出一新摘要内容并更新该摘要化累计次数值;
(H)将该新摘要内容更新至该文件群集历程记录文件中取代该笔子文件的摘要内容;
(I)更新该摘要化成功次数值;
(J)输出该摘要内容于显示端;
重复步骤(C)至步骤(K)步骤,直至该文件群集历程记录文件中所有的子文件摘要内容都被处理过为止。
2.根据权利要求1所述的文件群集的自动摘要判断方法,其特征在于,该文件群集为一网站或该网站的一频道内容。
3.根据权利要求1所述的文件群集的自动摘要判断方法,其特征在于,该文件群集历程记录文件中还设置有一计数值N。
4.根据权利要求1所述的文件群集的自动摘要判断方法,其特征在于,于步骤(C)还包含:
(C1)判断该摘要化累计次数值是否大于一第四门槛值,若该摘要化累计次数值小于该第四门槛值则进行(F)步骤;以及
(C2)若该摘要化累计次数值大于该第四门槛值则进行(D)步骤。
5.根据权利要求4所述的文件群集的自动摘要判断方法,其特征在于,该第四门槛值为20。
6.根据权利要求1或3所述的文件群集的自动摘要判断方法,其特征在于,该步骤(E)包含:
(E1)判断该摘要化成功率数值是否大于一第二门槛值,若该摘要化成功率数值大于该第二门槛值,则进行(F)步骤;
(E2)若该摘要化成功率数值小于该第二门槛值,则进行下列步骤:
(E21)计算该摘要化累计次数值及该文件累计数值,产生一摘要化频率数值;
(E22)判断该摘要化频率数值是否大于一第五门槛值,若该摘要化频率数值大于该第五门槛值,则进行(J)步骤;
(E23)若该摘要化频率数值小于该第五门槛值,则更新该计数值N,并判断该计数值N是否等于一第六门槛值,若该计数值N不等于该第六门槛值,则进行(J)步骤;
(E24)若该计数值N等于该第六门槛值,则将该计数值N归零并进行(F)步骤。
7.根据权利要求6所述的文件群集的自动摘要判断方法,其特征在于,该第二门槛值为0.5。
8.根据权利要求6所述的文件群集的自动摘要判断方法,其特征在于,该第五门槛值为0.1。
9.根据权利要求6所述的文件群集的自动摘要判断方法,其特征在于,该第六门槛值为4~6。
10.根据权利要求1或3所述的文件群集的自动摘要判断方法,其特征在于,于步骤(G)还包含:
(G1)比对该新摘要内容长度与该子文件的该摘要内容长度,若该新摘要内容长度小于该子文件的该摘要内容长度,则进行(J)步骤;以及
(G2)若该新摘要内容长度大于该子文件的该摘要内容长度,则进行(H)步骤。
11.根据权利要求1所述的文件群集的自动摘要判断方法,其特征在于,该摘要内容由文字、图片所组成。
12.根据权利要求1所述的文件群集的自动摘要判断方法,其特征在于,该新摘要内容由新摘要文字、新摘要图片所组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易搜比控股公司,未经易搜比控股公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110424071.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:兴趣点的地址信息的处理方法及设备
- 下一篇:一种标签显示方法及装置